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为 什么 编号 本 书 


Java 语 言 于 1995 年 首次 公开 发 布 ， 很 快 便 取得 
了 巨大 的 成 功 ， 成 为 使 用 最 为 广泛 的 编程 语言 


一 。 到 现在 ，Java 已 经 经 


一 工 一 工 


历 了 20 多 个 年 头 。 在 这 期 
间 ， 无 论 是 Java 语 言 本 身 : 


是 Java 虚 拟 机 技术 ， 都 取 
得 了 长 足 的 进步 


。 现 如 今 ，Java 依 然 长 期 占据 
TIOBE 由 网 站 的 编程 语言 排 
TIOBE 选 为 2015 年 度 


年 。 


于 榜首。 最 近 更 是 被 
度 编 程 语言 


风采 可 谓 不 减 当 


众所周知 ，Java 早 已 不 仅仅 是 一 个 单纯 的 语 


喜 ， 是 一 个 开放 的 平台 。 活 路 在 这 个 平台 之 上 的 
编程 语言 除了 Java 之 外 ，i 还 有 Groovy 1 |、 Scala 上 


Clojure 站 、Jython ol 和 JRuby1 | 等 。Java 虚 拟 机 则 是 
支持 这 个 平台 的 基石 。 


市 面 上 教授 Java 语 言 的 书籍 种 类 繁多 ， 相 比 之 
下 ， 介 绍 Java 虚 拟 机 的 书籍 却 是 凤毛麟角 。 这 足以 
说 明 Java 作 为 一 门 高 级 语言 是 多 么 成 功 〈 让 程序 员 
远离 底层 ) ,但 并 不 代表 Java 虚 拟 机 技术 不 重要 。 
恰恰 相反 ， 当 Java 语 言 掌握 到 一 定 程度 时 ，Java 虚 拟 


机 原理 自然 就 会 成 为 必须 越过 的 一 道 鸿 沟 。 


近 几 年 ， 内 涌现 出 了 一 些 讨论 Java 庶 拟 机 技 
术 的 优秀 书籍 ， 这 些 书籍 主要 以 分 析 OpenJDK 或 
Oracle JDK 为 主 。 本 书 另 辟 蹊 径 ， 带 领 读者 自己 动 
手 从 零 开 始 用 Go 语言 编写 Java 虚 拟 机 。 这 样 做 好 处 
颇 多 ， 弥 补 了 OpenJDK 等 虚拟 机 的 不 足 。 


首先 ，OpenJDK 等 虚拟 机 实现 非常 复杂 。 对 于 
初学 者 而 言 ， 很 容易 陷入 代码 的 海洋 和 不 必要 的 细 
节 之 中 。 其 次 ，OpenJDK 等 虚拟 机 大 多 用 C++ 语言 


编写 。C++ 语 言 非 常 复杂 ， 理 解 起 来 难度 很 大 。 最 
后 ， 单 纯 阅读 代码 比较 乏味 ,缺少 乐 超 ， 而 脱离 代 


码 又 很 难 透彻 讨论 技术 。 通 过 自己 动手 编写 代码 ， 
很 好 地 避免 了 上 述 问题 。 看 着 自己 实现 的 Java 虚 拟 
机 功能 逐渐 增强 ， 看 到 可 以 运行 的 Java 程 序 越 来 越 


复杂 ， 成 就 感 非常 强 。 总 之 ， 通 过 实践 的 方式 ， 相 


所 
一 一 一 


豆 o 


信 读 者 可 以 更 深刻 地 领悟 Java 虚 拟 机 的 工作 原理 。 


Go 是 Google 公 司 于 2012 年 推出 的 系统 编程 语 
从 到 硬件 的 距离 来 看 ，Go 


五 全 个 


1 号 | 


于 C 和 Java 之 
间 。Go 的 语法 和 C 类 似 ， 但 更 加 简洁 ， 因 此 很 容易 


学 习 。Go 语 言 内 置 了 丰富 的 基本 数据 类 型 ， 并 且 支 


持 结 构 体 ， 所 以 很 适合 用 来 实现 Java 虚 拟 机 。Go 支 
持 指针 ， 但 并 不 支持 指针 运算 ， 因 此 用 Go 编写 的 代 
码 要 比 C 代 码 更 加 安全 。 此 外 ，Go 还 支持 垃圾 回收 
和 接口 年 Java 类 语言 中 才 有 的 功能 ， 大 大 降低 了 实 
现 Java 虚 拟 机 的 难度 。 


以 上 是 本 书 采 用 Go 语言 编写 Java 虚 拟 机 的 原 
因 ， 和 硕 望 读者 在 学 习 本 书 的 过 程 中 ， 可 以 喜欢 上 Go 
这 门 还 很 年 轻 的 语言 。 


本 书 主要 内 容 
全 书 一 共 分 为 11 章 ， 各 章 内 容 安 排 如 下 : 


第 1 草 : 安装 开发 环境 ， 讨 论 java 命 令 ， 并 编写 


一 个 类 似 Java 的 命令 行程 序 。 


第 2 章 : 讨论 Java 虚 拟 机 如 何 搜 索 class 文 件 ， 实 


现 类 路 径 。 


析 。 


运行 


操作 


解释 


数据 


令 。 


第 3 草 : 讨论 class 文 件 结构 ， 实 现 class 文 件 解 


第 4 章 : 讨论 运行 时 数据 区 ， 实 现 线程 私有 的 


时 数据 区 ， 包 括 线程 、Java 庶 拟 机 栈 、 栈 帧 、 


数 栈 和 局 部 变量 表 等 。 


第 5 章 : 讨论 Java 虚 拟 机 指令 集 和 解释 器 ， 实现 


器 和 150 余 条 指令 。 


第 6 章 : 讨论 类 、 对 象 以 及 线程 共享 的 运行 时 


区 ， 实 现 类 加 载 器 、 方 法 区 以 及 部 分 引用 类 指 


第 7 章 : 讨论 方法 调用 和 和 返回， 实现 方法 调用 


和 返回 指令 。 

第 8 齐 : 讨论 数组 和 字符 串 ， 实 现 数组 相关 指 
令 和 字符 串 池 。 

第 9 章 : 讨论 本 地 方法 调用 ， 实 现 
ObjecthashCode () 等 本 地 方法 。 


今 


O 


System.outptinttn () 的 工作 原理 等 ， 并 对 全 书 进行 


本 书 主要 面向 有 一 定 经 验 的 Java 程 序 员 ， 但 任 
何 对 Java 虚 拟 机 工作 原理 感 兴趣 的 读者 都 可 以 从 本 
书 获 益 。 如 前 所 述 ， 本 书 将 使 用 Go 语言 实现 Java 虚 
拟 机 。 书 中 会 简要 介绍 Go 语言 的 部 分 语法 以 及 与 
Java 语 言 的 区 别 ， 但 不 会 深入 讨论 。 由 于 Go 语言 相 
对 比较 简单 ， 相 信任 何 有 C 系 列 语言 (如 C、CT++、 
C#、QObjective-C、Java 等 ) 经 验 的 读者 都 可 以 轻松 
读 懂 书 中 的 源 代码 。 


如 何 阅读 本 书 


本 书 代 码 经 过 精心 调整 ， 每 一 草 〈 第 1 齐 除 
外 ) 都 建立 在 前 一 章 的 基础 上 ， 但 每 一 章 又 都 可 以 
单独 编译 和 运行 。 本 书 内 容 主 要 围绕 代码 对 Java 虚 
拟 机 展开 讨论 。 读 者 可 以 从 第 1 章 开 始 ， 按 顺序 阅 
读本 书 并 运行 每 一 草 的 源 代 码 ， 也 可 以 直接 跳 到 感 


兴趣 的 章节 阅读 ， 必 要 时 再 阅读 其 他 章节 。 
参考 资料 
本 书 主要 参考 了 下 面 这 些 资料 : 
《Java 虚 拟 机 规范 》 第 8 版 
和 Java 语言 规范 》 第 8 版 
《深入 Java 虚 拟 机 》 ( 原 书 第 2 版 ) 加 


其 中 《Java 虚 拟 机 规范 》 主 要 参考 了 第 8 版 ， 但 
同时 也 参考 了 第 7 版 和 更 老 的 版 本 。 《Java 语 言 规 
范 》 则 主要 参考 了 第 8 版 。 读 者 可 以 从 
http://docs.oracle.com/javase/specs/index.html 获取 
各 个 版 本 的 《Java 虚 拟 机 规范 》 和 《Java 语 言 规 


学 》。 


笔者 早 在 十 年 前 还 在 上 学 时 就 读 过 由 Bi 
Vennets 著 ， 昔 了 晓 钢 等 翻译 的 《深入 Java 虚 拟 机 ( 原 
书 第 2 版 ) 》。 但 是 由 于 当时 水 平 有 限 ， 理 解 得 并 
不 是 很 深入 。 时 隔 十 年 ， 重 读 此 书 还 是 颇 有 收获 。 
较 之 《Java 虚 拟 机 规范 》 的 严谨 和 刻板 ， 该 书 更 加 
通俗 易 懂 。 原 书 作 者 已 经 将 部 分 章节 放 于 网 上 ， 网 
址 是 http://www.artima.com/insidejvm/ed2/ ， 读 者 可 


以 免费 阅读 。 


以 上 是 Java 方 面 的 资料 。Go 语 言 方面 主要 参考 
了 Go 官网 上 的 各 种 资料 ， 包 括 《 如 何 编写 Go 程 
序 》 中 《Effective Go》 1 《Go 语言 规范 》11 以 
及 Go 标准 库 文档 | 4 等 。 另 外， 在 本 书 的 写作 过 程 
中 ， 笔 者 还 通过 搜索 引擎 查阅 了 人 遍布 于 网 络 上 ( 特 
别 是 StackOverflow 1 | 和 Wikipedia 1 和) 的 各 种 资 


料 ， 这 里 就 不 一 一 罗列 了 。 
下 载 本 书 源 代码 


本 书 源 代码 可 以 从 
https:/ /sithub.comy/zxh0O/jvmgo-book 获取 。 代 码 分 
为 Go 和 Java 两 部 分 ， 目 隶 结构 如 下 : 


https://github.com/zxh0/jvmgo-book/vi/code/ 


|-example 


Go 语言 部 分 是 Java 虚 拟 机 代码 ， 每 章 为 一 个 子 
目录 ， 可 以 独立 编译 和 运行 。Java 语 言 部 分 是 Java 示 
例 代 码 ， 每 章 为 一 个 包 。Java 代 码 按 照 Gradle 1 工 
程 标准 目录 结构 组 织 ， 可 以 用 Gradle 编 译 整 个 工 


程 ， 也 可 以 用 javac 分 别 编译 每 个 文件 。 


甚 误 和 和文 持 


《Java 虚 拟 机 规范 》 对 Java 虚 拟 机 的 工作 机 制 有 
十 分 严谨 的 描述 。 但 是 由 于 笔者 水 平和 表达 能 力 有 
限 ， 本 书 一 定 存在 表述 不 精确 、 不 准确 ， 甚 至 不 正 
确 的 地 方 。 另 外 ， 由 于 时 间 有 限 ， 书 中 也 难免 会 有 


一 些 疏 汤 之 处 ， 还 请 读者 谅解 。 


本 书 的 勘误 将 通过 
https:/ /9ithub.com/zxh0/jvmeo- 
book/blob/master/v1/errata.md 发 布 和 更 新 。 如 果 读 
者 发 现 书 中 的 错误 、 有 改进 意见 ， 或 者 有 任何 问题 
需要 讨论 ， 都 可 以 在 本 书 的 Github 项 目 上 创建 
Issue。 此 外 也 可 以 加 入 QQ 群 (470333113) 与 读者 


一 一 


、 
父 Yo 


致谢 


首先 要 感谢 我 的 家 人 和 朋友 ， 没 有 你 们 的 鼓 
励 、 支 持 和 帮助 ， 本 书 不 可 能 面世 。 这 里 特别 感谢 
我 的 妻子 ， 在 我 陷入 低谷 的 时 候 ， 叮 驶 我 继续 努力 
不 要 放弃 。 还 有 我 的 朋友 范 森 ， 每 章 开头 的 可 爱 话 
鼠 就 是 出 自 他 手 ， 布 望 这 些 引 鼠 能 给 枯燥 的 文字 增 


添 一 些 色 彩 。 


其 次 感谢 我 所 在 的 公司 乐 元 素 1 | ， 它 为 我 提 
供 了 和 舒适 和 愉悦 的 工作 环境 ， 使 我 在 工作 之 余 可 以 
全 心 投入 本 书 的 写作 之 中 。 


代码 被 我 放 到 了 Github 上 ， 地 址 
是 https:/ /github.com/zxh0/jvm.eo 。 不 过 由 于 能 
和 时 间 有 限 ， 这 个 虚拟 机 离 完 整 实现 《Java 虚 拟 机 


规范 》 还 相距 甚 远 。2015 年 4 月 份 ， 我 停止 了 jvm.go 
的 编写 ， 同 时 开始 改造 代码 ， 酝 酿 本 书 。 感 谢 所 有 
关注 过 jvm.go 项 目的 人 ， 没 有 你 们 的 帮助 就 没有 
jvm.g0， 也 就 没有 本 书 。 


最 后 ， 感 谢 机 械 工业 出 版 社 华章 分 社 的 编辑 ， 
本 书 能 够 顺利 出 版 离 不 开 他 们 的 教 业 精神 和 一 丝 不 


多 的 工作 态度 。 
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Ee 

Java 虚 拟 机 非常 复杂 ， 要 想 真 正 理解 它 的 工作 
原理 ， 最 好 的 方式 就 是 自己 动手 写 一 个 。 本 书 的 目 
的 就 是 带领 读者 按照 Java 虚 拟 机 规范 上 ， 从 零 开 
始 ， 一 步 一 步 用 Go 语言 实现 一 个 功能 逐步 增强 的 
Java 虚 拟 机 。 第 1 章 将 编写 一 个 类 似 java 站 的 命令 行 
工具 ， 用 它 来 启动 我 们 自己 的 虚拟 机 。 在 开始 编写 
代码 之 前 ， 需 要 先 准备 好 开发 环境 。 


本 书 假 定 读者 使 用 的 是 Windows 操 作 系 统 ， 因 
此 书 中 出 现 的 命令 和 路 径 等 都 是 Windows 形 式 的 。 
如 果 读 者 使 用 的 是 其 他 操作 系统 (如 Mac OS X、 
Linux 等 ) ， 需 要 根据 自己 的 情况 做 出 相应 调整 。 
于 Go 和 Java 都 是 跨 平 台 语 言 ， 所 以 本 书 代 码 在 常见 


的 操作 系统 中 都 可 以 正常 编译 和 运行 


1 如 无 特殊 说 明 ， 本 书 中 出 现 的 “Java 康 拟 机 规 
范 ” 均 指 《Java 虚 拟 机 规范 第 8 版 >》 ， 网 址 为 
http:/ /docs.oracle.com/jJavase/ specs/jvms/se8/html/inc 


后 文中 ， 首 字母 小 写 的 java 特 指 java 命 令 行 工具 。 


[LT 全 1 
1.1.1 和 安装 JDK 


我 们 都 知道 ， 要 想 运 行 Java 程 序 ， 只 有 Java 虚 
拟 机 是 不 够 的 ， 还 需要 有 Java 类 库 。Java 虚 拟 机 和 
Java 类 库 一 起 ， 构 成 了 Java 运 行 时 环境 。 本 书 编写 
的 Java 虚 拟 机 依赖 于 JDK 类 库 ， 另 外 ， 编 译本 书 中 
的 Java 示 例 代码 也 需要 JDK。 从 Oracle 网 站 山上 下 
载 最 新 版 本 《写作 本 章 时 是 8u66) 的 JDK 安 猜 文 
件 ， 双 击 运行 即 可 。 安 装 完 毕 之 后 ， 打 开 命令 行 窗 
口 执 行 java-version 命 令 ， 如 果 看 到 类 似 图 1-1 所 示 的 
输出 ， 就 证 明 安 装 成 功 了 。 








国 命令 提示 符 
D:\>java -VerSsion 


java version “1.8.0 66° 


ry 


Java(TH) SE Runtime Environment (build 1.8.0 66-b18) 
IJava HotSpot (TH) 64-Bit Server VM (build 25.66-bl8, mixed mode) 





图 1-1 ”java-version 命 令 输 出 


[1 


http:/ /www.otacle.com/technetwork/java/javase/ down!l 


1.1.2 ”和 安装 Go 


从 Go 语言 官网 趾 下 载 最 新 版 本 (写作 本 章 时 
是 1.5.1) 的 Go 安 净 文件 ， 双 击 运 行 即 可 。 安 疤 完 毕 
之 后 ， 打 开 命令 行 窗 口 执行 go version 命 令 ， 如 末 看 
到 类 似 图 1-2 所 示 的 输出 ， 就 证 明 安 闭 成 功 了 。 








D:\>go version 
go version gol.5.1 windows/amd64 


D:\> 





图 1-2 ”go vetsion 命 令 输 出 


go 命令 是 Go 语言 提供 的 命令 行 工具 ， 用 来 
官 理 Go 源 代码 。go 命 令 束 像 瑞士 军刀 ， 里 面包 含 了 
各 种 小 工具 。 用 Go 语言 编写 程序 ， 基 本 上 只 需要 go 
命令 束 可 以 了 。go 命 令 里 的 小 工具 是 各 种 子 命令 ， 


version 是 其 中 之 一 。 其 他 常用 的 子 命令 包括 help、 


fmt、install 和 test 等 。 





go 命令 行 工具 希望 所 有 的 Go 源 代 码 被 都 放 在 一 
个 工作 空间 中 。 所 请 工作 空间 ， 实 际 上 束 是 一 个 目 
录 结 构 ， 这 个 日 录 结 构 包 含 三 个 子 日 录 。 








` stc 目 录 中 是 Go 语言 源 代 码 。 
.pkg 目录 中 是 编译 好 的 包 对 象 文 件 。 
bin 目 录 中 是 链接 好 的 可 执行 文件 。 


实际 上 只 有 src 目 录 是 必须 要 有 的 ，go 会 自动 创 
建 pkg 和 和 bin 目录 。 工 作 空 间 可 以 位 于 任何 地 方 ， 本 
书 使 用 D: \govworkspace 作 为 工作 空间 。 那 么 go 如 
何 知道 工作 空间 在 哪里 呢 ? 答案 是 通过 GOPATH 环 


境 变量 。 在 桌面 上 右键 单 击 “我 的 电脑 "图标 ， 在 弹 
出 的 菜单 中 单 击 “ 属 性 ”， 然 后 单 击 “ 高 级 系统 设 
置 ?， 在 “系统 属性 ?对 话 框 中 单 击 “环境 变量 ”按钮 ， 
然后 添加 GOPATH 变 量 即 可 ， 如 图 1-3 所 示 。 


系统 变量 (9) 





变量 值 

ComSpec C:\Windows\system32\cmd.exe 

[el@l Ys Di\go\workspace 

GOROOT C:\Go\ 

NUMBER OF PROCESSORS 1 

OS Windows_NT vy 











删除 (D 





图 1-3 ”设置 GOPATH 环 境 变量 


打开 命令 行 窗 口 ， 执 行 go env 人 命令， 如 果 看 到 
类 似 图 1-4 所 示 的 输出 ，GOPATH 环 境 变量 就 设置 
成 功 了 。 





5 命令 得 示 符 一 口 x 
D:\>go eny 
set GOMARCH=amd64 
set GOBIN= 
set GOEXE=. exe 
set GOHOSTARCH=amdé4 


set GOHOSTOS=windows 

set GOOS=windows 

set GOPATH=D: \go\workspace 
set GORACE= 





图 1-4 使 用 go env 命 令 查看 GOPATH 环 境 变 量 
[1] ”https://golang.org/dl/ (如 果 Go 官 网 无 法 访问 ， 
可 以 从 http://golangtc.com/download) 下 载 。 


2] 后 文中 ， 首 凶 母 小 写 的 go0 特 指 go 命令 行 工 具 。 





1.1.3 创建 目录 结构 











Go 语言 以 包 为 单位 组 织 源 代码 ， 包 可 以 拒 套 ， 
形成 层次 关系 。 本 书 编写 的 Go 源 文件 全 部 放 在 
jvmgo 包 中 ， 其 中 每 一 章 的 源 文件 又 分 别 放 在 自己 
的 子 包 中 。 包 层次 和 目录 结构 有 一 个 简单 的 对 应 关 
系 ， 比 如 ， 第 1 章 的 代码 在 jvmgovch01 目 录 下 。 除 第 
1 章 以 外 ， 每 一 章 都 是 先 复 制 前 一 章 代 码 ， 然 后 进 
行 修改 和 完善 。 每 一 章 的 代码 都 是 独立 的 ， 可 以 单 
独 编 译 为 一 个 可 执行 文件 。 下 面 创 建 第 1 章 的 目录 
结构 。 








在 D: \goxworkspace\src〈 也 残 
是 %GOPATHo%6vsrc) 目录 下 创建 jvmgo 目 录 ， 在 
jvmgo 目 录 下 创建 ch01 目 录 。 现 在 ， 工 作 空间 的 目 





录 结 构 如 下 : 





D:\go\workspace\src 
|-jvmgo 
|-cho1 





1.2 java 命令 


Java 虚 拟 机 的 工作 是 运行 Java 应 用 程序 。 和 其 
他 类 型 的 应 用 程序 一 样 ，Java 应 用 程序 也 需要 一 个 
入 口 点 ， 这 个 入 口 点 就 是 我 们 熟知 的 main《〈) 方 
法 。 如 果 一 个 类 包含 main() 方法 ， 这 个 类 就 可 以 
用 来 启动 Java 应 用 程序 ， 我 们 把 这 个 类 叫 作 主 类 。 
最 简单 的 Java 程 序 是 只 有 一 个 main 〈) 方法 的 类 
如 著名 的 HelloWorld 程 序 。 





public class Helloworld { 
public static void main(String[] args) { 
System.out.println("Hello, world!"); 


那么 Java 虚 拟 机 如 何 知道 我 们 要 从 哪个 类 启动 
应 用 程序 呢 ? 对 此 ，Java 虚 拟 机 规范 没有 明确 规 


定 。 也 就 是 说 ， 是 由 虚拟 机 实现 自行 决定 的 。 比 如 
Oracle 的 Java 虚 拟 机 实现 是 通过 java 命 令 来 启动 的 ， 
主 类 名 由 命令 行 参数 指定 。java 命 令 有 如 下 4 种 形 


式 : 


java [-options] class [args |】 

java [-options] -jar jarfile [args] 
javaw [-options] class [args] 

javaw [-options] -jar jarfile [args] 


可 以 同 java 命 令 传 递 三 组 参数 : 选项 、 主 类 名 
(或 者 JAR 文 件 名 ) 和 main 〈) 方法 参数 。 选 项 由 
减 写 (-) 开 涉 。 通 第 ， 第 一 个 非 选 项 参数 给 出 主 
类 的 完全 限定 名 (fully qualified class name) 。 但 
是 如 采用 户 提供 了 -jar 选 项 ， 则 第 一 个 非 选项 参数 
表示 JAR 文 件 名 ，java 命 令 必 须 从 这 个 JAR 文 件 中 寻 
找 主 类 。javaw 命 令 和 java 命 令 几 乎 一 样 ， 唯 一 的 差 


别 在 于 ，javaw 命 令 不 显示 命令 行 窗口 ， 因 此 特别 














适合 用 于 局 动 GUI《〈 图 形 用 户 界 面 ) 应 用 程序 。 


选项 可 以 分 为 两 类 ， 标准 选项 和 非 标准 选项 。 
标准 选项 比较 稳定 ， 不 会 轻易 变动 。 非 标准 选项 

以 -XxX 开头 ， 很 有 可 能 会 在 未 来 的 版 本 中 变化 。 非 标 
准 选项 中 有 一 部 分 是 高 级 选项 ， 以 -XX 开头 。 表 1-1 
列 出 了 java 命 令 常 用 的 选项 及 其 用 途 。 





表 1-1 java 命 令 党 用 选项 及 其 用 途 

















选 项 用 途 
-version 输出 版 本 信息 ， 然 后 退出 
-2?/ -help 输出 帮助 信息 ， 然 后 退出 
-cp / -classpath 指定 用 户 类 路 径 
-Dproperty=value 设置 Java 系统 属性 
-Xms<size> 设置 初始 堆 空间 大 小 
-Xmx<size> 设置 最 大 堆 空 间 大 小 
-Xss<size> 设置 线程 栈 空间 大 小 
[1] 完整 的 java 命 令 用 法 请 参考 


http:/ /docs.oracle.com/javase/ 8/docs/technotes/tools/ 


1.3 编写 命令 行 工具 


开发 环境 已 经 准备 束 绪 ，java 命 令 也 已 经 介绍 
完毕 ， 相 信 读 者 已 经 迫不及待 想 开 始 写 代 码 了 吧 ! 
下 和 面 根据 java 命 令 的 第 一 种 用 法 ， 目 己 动手 编写 一 


个 类 似 的 命令 行 工具 。 





先 定义 一 个 结构 体 来 表示 命令 行 选项 和 参数 。 
在 ch01 目 录 下 创建 cmd.go 文 件 !H， 用 你 喜欢 的 文本 
编辑 器 1 站 打开 它 ， 然 后 在 其 中 定义 Cmd 结 构 体 ， 
代码 如 下 : 





package main 
import "flag" 
import "fmt" 
import "os" 

type Cmd struct { 


helpFlag bool 
versionFlag bool 
cpOption string 
class string 


args [jstring 


在 Java 语 言 中 ，API 一 般 以 类 库 的 形式 提供 。 
在 Go 语言 中 ，API 则 是 以 包 〈package) 的 形式 提 
供 。 包 可 以 向 用 户 提供 常量 、 变 量 、 结 构 体 以 及 函 
数 等 。Java 内 置 了 丰富 的 类 库 ，Go 也 同样 内 置 了 功 
能 强大 的 包 。 本 章 将 用 到 fmt、os 和 flag 包 。 








包 定 义 了 一 个 Args 变 量 ， 其 中 存放 传递 给 命 
行 的 全 部 参数 。 如 采 直 接 处 理 os.Args 变 量 ， 需 要 
写 很 多 代码 。 还 好 Go 语言 内 置 了 flag 包 ， 这 个 包 可 
以 帮助 我 们 处 理 命令 行 选项 。 有 了 flag 包 ， 我 们 的 
工作 惑 简 单 了 很 多 。 继 续 编辑 cmd.go 文 件 ， 在 其 中 
定义 parseCmd() 函数 ， 代 码 如 下 : 





func parseCmd() *Cmd { 
cmd := &Ccmd{ 
flag.Usage = printUsage 
flag.BoolVar(&cmd.helpFlag, "help", false, "print help mess 
flag.BoolVar(&cmd.helpFlag, "?", false, "print help message 


flag.BoolVar(&cmd.versionFlag, "version", false, "print ver 
flag.SstringVar(&cmd.cpOption, "classpath", "", "classpath") 
flag.StringVar(&cmd.cpOption, "cp", "", "classpath") 
flag.Parse() 
args := flag.Args() 
If len(args) > 0 

cmd.class = args[0] 

cmd.args = args[1:] 


return cmd 


首先 设置 flag.Usage 变 量 ， 把 printUsage () 
ee 
数 设 置 需 要 解析 的 选项 ， 接 着 调 用 Parse() 函数 解 
析 选 项 。 如 果 Parse〈) 函数 解析 失败 ， 它 就 调用 
printUsage《〈) 函数 把 命令 的 用 法 打印 到 控制 全。 
printUsage 〈) 函数 的 代码 如 下 : 


到 
到 


func printUsage() { 
fmt.Printf("Usage: %s [-options] class [args...1]\n", os.Arg 
} 


如 果 解 析 成 功 ， 调 用 flag.Args () 也 数 可 以 捕 
获 其 他 没有 被 解析 的 参数 。 其 中 第 一 个 参数 束 是 主 





类 名 ， 剩 下 的 是 要 传递 给 主 类 的 参数 。 这 样 ， 用 了 
不 到 40 行 代码 ， 我 们 的 命令 行 工 具 束 编写 完了 。 下 
面 来 测试 它 。 








[11] ”Go 源 文 件 一 般 以 .go 作为 后 级 ， 文 件 名 全 部 小 
写 ， 多 个 单词 之 间 用 下 划 线 分 隔 。Go 语 言 规范 要 求 
Go 源 文件 必须 使 用 UTF-8 编 码 ， 详 见 

https:/ /golang.org/ref/spec。 

2 笔者 推荐 Sublime2， 主 页 为 
http:/ /www.sublimetext.com/。 

[3] Go 语言 有 函数 (Function) 和 方法 (Method) 之 


分 ， 方 法 调用 需要 teceiveft， 函 数 调 用 则 不 需要 。 


1.4 测试 本 章 代 码 


在 ch01 目 录 下 创建 main.go 文 件 ， 然 后 输入 下 面 
的 代码 。 


package main 
import "fmt" 
func main() { 
cmd := parseCmd() 
if cmd.versionFlag { 
fmt.Println("version 0.0.1") 
} else if cmd.helpFlag || cmd.class == "" { 
printUsage() 
} else { 
startJVM(cmd) 


注意 ， 与 cmd.go 文 件 一 样 ，main.go 文 件 的 包 名 
也 是 main。 在 Go 语言 中 ，main 是 一 个 特殊 的 包 ， 这 
个 包 所 在 的 目录 《可 以 叫 作 任何 名 字 ) 会 被 编译 为 
可 执行 文件 。Go 程 序 的 入 口 也 是 main 〈) 函数 ， 但 
是 不 接收 任何 参数 ， 也 不 能 有 返回 值 。 





main () 函数 先 调 用 ParseCommand () 函数 
解析 命令 行 参 数 ， 如 果 一 切 正 常 ， 则 调用 
startJVM 〈) 函数 启动 Java 虚 拟 机 。 如 果 解 析出 现 
错误 ， 或 者 用 户 输入 了 -heljp 选 项 ， 则 调用 
PrintUsage〈) 函数 打印 出 帮助 信息 。 如 果 用 成 输 
入 了 -version 选 项 ， 则 输出 一 个 滥 午 充 数 的 ) 版 本 
言 轧 。 因 为 我 们 还 没有 真正 开始 编写 Java 虚 拟 机 ， 
所 以 starUJVM () 函数 暂时 只 是 打印 一 些 信 息 而 
已 ， 代 码 如 下 : 


func startJVM(cmd *Cmd) { 
fmt.Printf("classpath:%s class:%s args:%v\n", 
cmd.cpOption, cmd.class, cmd.args) 


打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 代 
但。 


go install jvmgoxcho1L 


命令 执行 完毕 后 ， 如 果 没 有 看 到 任何 输出 就 证 
明 编 译 成 功 了 ， 此 时 在 D:，\govworkspace\bin 目 录 下 
会 出 现 ch01.exe 文 件 。 现 在 ， 可 以 用 各 种 参数 进行 
测试 。 笔 者 的 测试 结果 如 图 1-5 所 示 。 





画 命令 提示 符 


D:\go\workspace\bin>ch01. exe -help 
Usage: ch0l. exe [-options] class [args...] 


D:\go\workspace\bin>ch01, exe -version 
version 0.0.1 


D:\go\workspace\bin>ch0l1. exe -cp foo/bar yApp argl arg2 
classpath:foo/bar class:JyApp args: [argl arg2 





图 1-5 ”ch01.exe 测 试 结果 


1.5 本章 小 结 


本 章 准 备 好 了 开发 环境 ， 学习 了 java 命 令 的 基 
本 用 法 ， 并 且 编 写 了 一 个 简化 版 的 命令 行 工 具 。 虽 
然 还 没有 正式 开始 编写 Java 虚 拟 机 ,但 是 已 经 打 好 
了 坚实 的 基础 。 下 一 章 将 深入 了 解 -classpath 选 项 ， 
探讨 Java 虚 拟 机 从 哪里 寻找 class 文 件 ， 并 实现 class 文 


件 加 载 功能 。 


第 2 草 ” 搜 索 class 文 件 


第 1 章 介 绍 了 java 命 令 的 用 法 以 及 它 如 何 居 动 
Java 应 用 程序 : 首先 启动 Java 虚 拟 机 ， 然 后 加 载 主 
类 ， 最 后 调用 主 类 的 main () 方法 。 但 是 我 们 知 
道 ， 即 使 是 最 简单 的 “Hello，World ” 程序， 也 是 
无 法 独自 运行 的 ， 该 程序 的 代码 如 下 : 

public class Helloworld { 
public static void main(String[|] args) { 
System.out.println("Hello, world!"); 
} 
} 
加 载 HelloWotrld 类 之 前 ， 首 先 要 加 载 它 的 起 
类 ， 也 就 是 java.lang.Object。 在 调用 main () 方法 之 
前 ， 因 为 虚拟 机 需要 准备 好 参数 数组 ， 所 以 需要 加 


载 java.lang.String 和 java.lang.String[| 类。 把 字符 束 打 印 


到 控制 台 还 需要 加 载 java.lang'System 类 ， 等 等 。 那 
么 ，Java 虚 拟 机 从 哪里 寻找 这 些 类 呢 ? 本 章 将 详细 


讨论 这 个 问题 。 





Java 虚 拟 机 规范 并 没有 规定 虚拟 机 应 该 从 哪里 
寻找 类 ， 因 此 不 同 的 虚拟 机 实现 可 以 采用 不 同 的 方 
法 。Oracle 的 Java 虚 拟 机 实现 根据 类 路 径 (class 
path) 来 搜索 类 。 按 照 搜索 的 先后 顺序 ， 类 路 径 可 
以 分 为 以 下 3 个 部 分 : 





` 启动 类 路 径 (bootstrap classpath) 
扩展 类 路 径 (extension classpath) 
* 用 户 类 路 径 (usetr classpath) 


启动 类 路 径 默认 对 应 jrelib 目 录 ，Java 标 准 库 
(大 部 分 在 rtjar 里 ) 位 于 该 路 径 。 扩 展 类 路 径 默认 


对 应 jreMlib\ext 目 录 ， 使 用 Java 扩 展 机 制 的 类 位 于 这 
个 路 径 。 我 们 自己 实现 的 类 ， 以 及 第 三 方 类 库 则 位 
于 用 户 类 路 径 。 可 以 通过 -Xbootclasspath 选 项 修改 
局 动 类 路 径 ， 不 过 通常 并 不 需要 这 样 做 ， 所 以 这 里 
就 不 详细 介绍 了 。 


用 户 类 路 径 的 默认 值 是 当前 目录 ， 也 就 是 “.”。 
可 以 设置 CLASSPATH 环 境 变量 来 修改 用 户 类 路 
径 ， 但 是 这 样 做 不 够 灵活 ， 所 以 不 推荐 使 用 。 更 好 
的 办 法 是 给 java 命 令 传递 -classpath( 或 简写 为 -cp) 
选项 。-classpath/-cp 选 项 的 优先 级 更 高 ， 可 以 宪 疙 
CLASSPATH 环 境 变 量 设 置 。 第 1 章 简 单 介绍 过 这 个 
项 ， 这 里 再 详细 解释 一 下 


-Classpath/-cp 选 项 既 可 以 指定 目录 ， 也 可 以 指 
定 JAR 文 件 或 者 ZIP 文 件 ， 如 下 : 


java -cp path\to\classes ... 
Java -cp path\to\libi1.jar ... 
Java -cp path\to\lib2.zip ... 


还 可 以 同时 指定 多 个 目录 或 文件 ， 用 分 隅 符 分 
。 分 隔 符 因 操 作 系统 而 民 。 在 Windows 系 统 


下 是 分 号 ， 在 类 UNIX (包括 Linux、Mac OS X 等 ) 


习 


系统 下 是 冒号 。 例 如 在 Windows 下 : 


java -cp path\to\classes;lib\a.jar;lib\b.jar;lib\c.zip ... 


从 Java 6 开始 ， 还 可 以 使 用 通配符 〈*) 指定 菏 
个 目录 下 的 所 有 JAR 文 件 ， 格 式 如 下 : 


Java -cp classes;lib\* ... 


22 人 和 备 人 





从 第 2 章 开 始 ， 每 章 的 代码 者 是 建立 在 前 一 
的 基础 之 上 。 把 ch01 目 录 复 制 一 份 ， 然 后 改名 为 
ch02。 因 为 本 章 要 创建 的 源 文件 都 在 classpath 包 
中 ， 所 以 在 ch02 目 录 中 创建 一 个 classpath 子 目录 。 
现在 日 录 结 构 看 起 来 应 该 是 这 样 : 








D:\go\workspace\src 
| -jvmgo 
|-cho1 
| -cho2 
|-classpath 
| -cmd ,go 
| -main ,go 


我 们 的 Java 虚 拟 机 将 使 用 JDK 的 局 动 类 路 径 来 
寻找 和 加 载 Java 标 准 库 中 的 类 ， 因 此 需要 某 种 方式 
指定 jre 目 录 的 位 置 。 命 令 行 选项 是 个 不 错 的 选择 ， 


所 以 增加 一 个 非 标 准 选项 -Xjre。 打 开 
ch02\cmd.go， 人 和 修改 Cmd 结 构 体 ， 添 加 XjreOption 字 
段 ， 代 人 硝 如 下 ， 





type Cmd struct { 


helpFlag bool 
versionFlag bool 
cpOption string 
XjreOoption string 
class string 
args []string 





parseCmd 〈) 函数 也 要 相应 修改 ， 代 码 如 下 : 





func parseCcmd() *Cmd { 
cmd := &Cmd{} 
flag.Usage = printUsage 
flag.BoolVar(&cmd.helpFlag, "help", false, "print help mess 
flag.BoolVar(&cmd.helpFlag, "?", false, "print help message 
flag.BoolVar(&cmd.versionFlag, "version", false, "print ver 
flag.SstringVar(&cmd.cpOption, "classpath", "", "classpath") 
flag.SstringVar(&cmd.cpOption, "cp", "", "classpath") 
flag.StringVar(&cmd.XjreOption, "Xxjre", "", "path to jre") 
flag.Parse() 

，// 其 他 代码 不 变 





2.3 ”实现 类 路 径 


可 以 把 类 路 径 想 象 成 一 个 大 的 整体 ， 它 由 局 动 
类 路 人 径 、 扩 展 类 路 人 径 和 用 户 类 路 径 三 个 小 路 全 构 
成 。 三 个 小 路 径 又 分 别 由 更 小 的 路 径 构 成 。 是 不 是 
很 像 组 合 模式 (composite pattern) ? 没 错 ， 本 节 就 
套用 组 合 模式 来 设计 和 实现 类 路 径 。 


2.3.1 Entry 接 口 


先 定义 一 个 接口 来 表示 类 路 径 项 。 在 
ch02\classpath 目 录 下 创建 entry.go 文 件 ， 在 其 中 定义 
Entry 接 口 ， 代 码 如 下 : 


package classpath 
import "os" 
import "strings" 
const pathListSeparator = string(os.PathListSeparator) 
type Entry interface { 
readcCclass(className string) ([]byte, Entry, error) 
String() string 


func newEntry(path string) Entry {...} 


种 量 pathListSeparator 是 String 类型， 存放 路 径 
分 隔 符 ， 后 面 会 用 到 。Entry 接 口中 有 两 个 方法 。 
readClass〈) 方法 负责 寻找 和 加 载 class 文 件 ; 
String〈) 方法 的 作用 相当 于 Java 中 的 
toString() ， 用 于 返回 变量 的 字符 串 表 示 。 











readClass《〈) 方法 的 参数 是 class 文 件 的 相对 路 
径 ， 路 径 之 间 用 笠 线 (/) 分 隅 ， 文 件 名 有 .class 后 
级 。 比 如 要 读 取 java.lang.Object 类 ， 传 入 的 参数 应 
该 是 java/lang/Object.class。 返 回 值 是 读 取 到 的 字 节 
数据 、 最 终 定位 到 class 文 件 的 Entry， 以 及 错误 信 
思 。Go 的 函数 或 方法 允许 返回 多 个 值 ， 按 照 惯例 ， 
可 以 使 用 最 后 一 个 返回 值 作为 错误 信息 。 


newEntry () 函数 根据 参数 创建 不 同类 型 的 
Entry 实 例 ， 代 码 如 下 : 





func newEntry(path string) Entry { 

if strings.Contains(path, pathListSeparator) { 
return newCompositeEntry(path ) 

} 

if strings.HasSuffix(path, "™*") { 
return newwildcardEntry(path ) 

} 

if strings.HasSuffix(path, ".jar") || strings.HasSuffix(pat 
strings.HasSuffix(path, ".zip") || strings.HasSuffix(pat 
return newZipEntry(path) 


return newDirEntry(path ) 


Entry 接 口 有 4 个 实现 ， 分 别 是 DirEntry、 
ZipEntry、CompositeEntry 和 WildcardEntry。 下 面 分 


别 介 绍 每 一 种 实现 。 


2.3.2 DirEntry 


在 4 种 实现 中 ，DirEntry 相 对 简单 一 些 ， 表 示 目 
录 形 式 的 类 路 径 。 在 ch02\classpath 目 录 下 创建 
entry_dir.go 文 件 ， 在 其 中 定义 DirEntry 结 构 体 ， 代 
码 如 下 : 


package classpath 
import "io/ioutil" 
import "path/filepath" 
type DirEntry struct { 
absDir string 


func newDirEntry(path string) *DirEntry {...} 
func (self *DirEntry) readClass(className string) ([lbyte , En 
func (self *DirEntry) String() string {...} 





DirEntry 只 有 一 个 字段 ， 用 于 存放 目录 的 绝对 
路 径 。 和 Java 语 言 不 同 ，Go 结 构 体 不 需要 显示 实现 
接口 ， 只 要 方法 匹配 即 可 。Go 没 有 专门 的 构造 函 
数 ， 本 书 统一 使 用 new 开 头 的 函数 来 创建 结构 体 实 





例 ， 并 把 这 类 函数 称 为 构造 函数 。newDirEntry 〈 ) 
函数 的 代码 如 下 : 


func newDirEntry(path string) *DirEntry { 
absDir, err := filepath.Abs(path) 
if err != nil { 
panic(err) 


} 
return &DirEntry{absDir} 
} 


newDirEntry 〈) 先 把 参数 转换 成 绝对 路 径 ， 如 
条 转换 过 程 出 现 错 误 ， 则 调用 panic〈) 函数 终止 程 
序 执行 ， 否 则 创建 DirEntry 实 例 并 返回 


下 面 介 绍 readClass () 方法 : 


func (self *DirEntry) readClass(className string) ([lbyte, Ent 


fileName := filepath.Join(self.absDir, classNanme) 
data, err := ioutil.ReadFile(fileNanme) 
return data, self, err 


} 





readClass〈) 先 把 目录 和 class 文 件 名 拼 成 一 个 


完整 的 路 径 ， 然 后 调用 ioutil 包 提供 的 ReadFile 〈 ) 
国 数 读 取 class 文 件 内 容 ， 最 后 返回 。String () 方 
func (self *DirEntry) String() string { 


return self.absDir 


} 


2.3.3 ZipEntry 


ZipEntry 表 示 ZIP 或 JAR 文 件 形 式 的 类 路 径 。 在 
ch02\classpath 目 录 下 创建 entry_zip.go 文 件 ， 在 其 中 
定义 ZipEntry 结 构 体 ， 代 人 码 如 下 : 





package classpath 
import "archive/zip" 
import "errors" 
import "io/ioutil" 
import "path/filepath" 
type ZipEntry struct { 
absPath string 
} 
func newZipEntry(path string) *ZipEntry {...} 
func (self *ZipEntry) readClass(className string) ([]jbyte，Ent 
func (self *ZipEntry) String() string {...} 





absPath 字 段 存 放 ZIP 或 JAR 文 件 的 绝对 路 径 。 
构造 函数 和 String () 与 DirEntry 大 同 小 异 ， 束 不 多 
解释 了 ， 代 码 如 下 : 





func newZipEntry(path string) *ZipEntry { 
absPath, err := filepath.Abs(path) 


if err != nil { 
panic(err) 


return &ZipEntry{absPath} 

} 

func (self *ZipEntry) String() string { 
return self.absPath 


} 





下 面 重点 介绍 如 何 从 ZIP 文 件 中 提取 class 文 
件 ， 代 码 如 下 : 





func (self *ZipEntry) readClass(className string) ([]jbyte，Ent 
r, err := zip.OpenReader(self.absPath) 
if err != nil { 
return nil, nil, err 


} 
defer r.closel() 


for _, f := range r.File { 
If f.Name == className { 
rc, err := f.Open() 
if err != nil { 


return nil, nil, err 
} 
defer rc.closel() 
data, err := ioutil.ReadAll(rc) 
if err != nil { 
return nil, nil, err 


} 


return data, self, nil 


上 
小 


return nil, nil, errors.New("class not found: " + className 


首先 打开 ZIP 文 件 ， 如 果 这 一 步 出 错 的 话 ， 直 
接 返 回 。 然 后 遍历 ZIP 压 缩 包 里 的 文件 ， 看 能 否 找 
到 class 文 件 。 如 果 能 找到 ， 则 打开 class 文 件 ， 把 内 
容 读 取出 来 ， 并 返回 。 如 果 找 不 到 ， 或 者 出 现 其 他 
音 误 ， 则 返回 错误 信息 。 有 两 处 使 用 了 defer 语 名 来 
确保 打开 的 文件 得 以 关闭 。readClass() 方法 每 次 
都 要 打开 和 关闭 ZIP 文 件 ， 因 此 效率 不 是 很 蜗 。 笔 
者 进行 了 优化 ， 但 鉴于 篇 幅 有 限 ， 融 不 展示 具体 代 
码 了 。 感 兴趣 的 读者 可 以 阅读 
ch02\classpath\entry_zip2.go 文 件 。 











2.3.4 CompositeEntry 


在 ch02\classpath 目 录 下 创建 entry_composite.go 
文件 ， 在 其 中 定义 CompositeEntry 结 构 体 ， 代 码 如 
下 : 


package classpath 

import "errors" 

import "strings" 

type CompositeEntry []jEntry 

func newCompositeEntry(pathList string) CompositeEntry {...} 
func (self CompositeEntry) readClass(className string) ([]jbyte 
func (self CompositeEntry) String() String {...} 


如 前 所 述 ，CompositeEntry 由 更 小 的 Entry 组 
成 ， 正 好 可 以 表示 成 [Entry。 在 Go 语言 中 ， 数 组 属 
于 比较 低层 的 数据 结构 ， 很 少 直 接 使 用 。 大 部 分 情 
况 下 ， 使 用 更 便利 的 slice 类 型 。 构 造 函数 把 参数 
路径 列 表 ) 按 分 隔 符 分 成 小 路 径 ， 然 后 把 每 个 小 


路 径 都 转换 成 具体 的 Entry 实 例 ， 代 码 如 下 : 





func newCompositeEntry(pathList string) CompositeEntry { 
compositeEntry := [J]JEntry{} 
for _, path := range strings.Split(pathList, pathListSepara 
entry := newEntry(path) 
compositeEntry = append(compositeEntry, entry) 


return compositeEntry 


: 





相信 读者 已 经 想到 readClass() 方法 的 代码 
了 : 依次 调用 每 一 个 子路 径 的 readClass() 方法 ， 
如 琳 成 功 读 取 到 class 数 据 ， 人 返回 数 据 即 可 ; 如 果 收 
到 错误 信息 ， 则 继续 ;， 如 果 遍 历 完 所 有 的 子路 径 还 
没有 找到 class 文 件 ， 则 返回 错误 。readClass () 方 
法 的 代码 如 下 : 





func (self CompositeEntry) readClass(className string) ([]jbyte 


for _, entry := range self { 
data, from, err := entry.readcClass(className) 
if err == nil { 


return data, from, nil 


return nil, nil, errors.New("class not found: " + className 


String 〈) 方法 也 不 复杂 。 调 用 每 一 个 子路 径 
的 String〈) 方法 ， 然 后 把 得 到 的 字符 串 用 路 径 分 
隔 符 拼 接 起 来 即 可 ， 代 码 如 下 : 





func (self CompositeEntry) String() String { 
strs := make([]string, len(self)) 
for i, entry := range self { 
strs[i] = entry.String() 
} 
return strings.Join(strs, pathListSeparator) 


} 


[| 


2.3.5 WildcardEntry 


WildcardEntry 实 际 上 也 是 CompositeEntry， 上 所 
以 就 不 再 定义 新 的 类 型 了 。 在 ch02\classpath 目 录 下 
创建 entry_wildcard.go 文 件 ， 在 其 中 定义 
newWildcardEntry 〈) 函数 ， 代 人 码 如 下 : 


package classpath 
import "os" 
import "path/filepath" 
import "strings" 
func newwWildcardEntry(path string) CompositeEntry { 
baseDir := path[:len(path)-1] // remove * 
compositeEntry := []Entry{} 
walkFn := func(path string, info os.FileInfo, err error) er 
filepath.walk(baseDir, walkFn) 
return compositeEntry 








首先 把 路 径 末 尾 的 星 号 去 反 ， 得 到 baseDir， 然 
后 调用 filepath 包 的 Walk () 函数 遍历 baseDir 创 建 
ZipEntry。Walk《〈) 函数 的 第 二 个 参数 也 是 一 个 函 





数 ， 了 解 函 数 式 编程 的 读者 应 该 一 眼 束 可 以 认 出 这 
种 用 法 〔 即 函数 可 作为 参数 ) 。walkFn 变 量 的 定义 
如 下 : 





walkFn := func(path string, info os.FileInfo, err error) error 
if err != nil { 
return err 


if info.IsDir() && path != baseDir { 
return filepath.SkipDir 

} 

if strings.HasSuffix(path, ".jar") || strings.HasSuffix(pat 
JarEntry := newZipEntry(path ) 
compositeEntry = append(compositeEntry, jarEntry) 

} 


return nil 








在 walkFn 中 ， 根 据 后 级 名 选 出 JAR 文 件 ， 并 且 
返回 SkipDir 跳 过 子 日 录 〈 通 配 符 类 路 径 不 能 递归 匹 
配子 目录 下 的 JAR 文 件 ) 。 


2.3.6 Classpath 


Entry 接 口 和 4 个 实现 介绍 完了 ， 接 下 来 实现 
Classpath 结 构 体 。 还 是 在 ch02\classpath 目 录 下 创建 
classpath.go 文 件 ， 把 下 面 的 代码 输入 进去 。 


package classpath 

import "os" 

import "path/filepath" 

type Classpath struct { 
bootClasspath Entry 
extClasspath Entry 
userClasspath Entry 


func Parse(jreOption, cpOption string) *Classpath {...} 
func (self *Classpath) ReadClass(className string) ([l]byte, En 
func (self *Classpath) String() string {...} 


Classpath 结 构 体 有 三 个 字段 ， 分 别 存放 三 种 类 
路 径 。Parse〈() 函数 使 用 -Xjre 选 项 解析 启动 类 路 径 
和 扩展 类 路 径 ， 使 用 -classpath/-cp 选 项 解析 用 户 类 
路 径 ， 代 码 如 下 : 


func Parse(jreOption, cpOption string) *Classpath { 
cp := &Classpath{} 
cp.parseBootAndExtClasspath(jreOoption) 
cp.parseUserClasspath(cpOption) 
return cp 


} 





parseBootAndExtClasspath〈) 方法 的 代码 如 
下 : 





func (self *Classpath) parseBootAndExtClasspath(jreOption stri 
JreDir := getJreDir(jreOption) 
// jre/lib/* 
jreLibPath := filepath.Join(jreDir, "1ib", "*") 
self.bootClasspath = newwWildcardEntry(jreLibPath ) 
// jre/lib/ext/* 
JreExtPath := filepath.Join(jreDir, "1ib", "ext", "*") 
self.extClasspath = newwWildcardEntry(jreExtPath) 





优先 使 用 用 户 输入 的 -Xjre 选 项 作为 jre 目 录 。 如 
果 没 有 输入 该 选项 ， 则 在 当前 目录 下 寻找 jre 目 录 。 
如 果 找 不 到 ， 尝 试 使 用 JAVA_HOME 环 境 变 量 。 
getJreDir () 函数 的 代码 如 下 : 








func getJreDir(jreoption string) string { 
if jreOption != "" && exists(jreOption) { 


return jreOption 


if exists("./jre") { 
return "./jre" 

} 

if jh := os.Getenv("JAVA HOME"); jh != "" { 
return filepath.Join(jh, "jre") 


panic("Can not find jre folder!") 








exists 〈) 函数 用 于 判断 目录 是 否 存 在 ， 代 码 
如 下 : 





func exists(path string) bool { 
If _, err := os.Stat(path); err != nil { 
if os.IsNotExist(err) { 
return false 
} 
} 


return true 





parseUserClasspath〈) 方法 的 代码 相对 简单 一 
些 ， 如 下 : 





func (self *Classpath) parseUserClasspath(cpOption string) { 
If cpOption == "™ { 
CpOption = "." 


self.userClasspath = newEntry(cpOption) 





如 果 用 户 没 有 提供 -classpath/-cp 选 项 ， 则 使 用 
当前 目录 作为 用 户 类 路 径 。ReadClass 〈) 方法 依次 
从 启动 类 路 径 、 扩 展 类 路 径 和 用 户 类 路 径 中 搜索 
class 文 件 ， 代 码 如 下 : 








func (self *Classpath) ReadClass(className string) ([l]byte, En 
className = className + ".class" 
If data, entry, err := self.bootClasspath.readClass(classNa 
return data, entry, err 


If data, entry, err := self.extClasspath.readcCclass(classNan 
return data, entry, err 


return self.userClasspath.readClass(classNanme) 





注意 ， 传 递 给 ReadClass 〈) 方法 的 类 名 不 包 
含 “.class” 后 缀 。 最 后 ，String () 方法 返回 用 户 类 
路 径 的 字符 串 表 示 ， 代 但 如 下 : 








func (self *Classpath) String() String { 
return self.userClasspath.Sstring() 


至 此， 人 整个 类 路 径 都 实现 了 ， 下 面 我 们 来 测试 
下。 


2.4 


负 试 本 章 代 但 


打开 ch02/mmain.go 文 件 ， 添 加 两 条 import 语 句 ， 


代码 如 下 : 





package main 

import "fmt" 

import "strings" 

import "jvmgo/ch02/classpath" 
func main() {...} 

func startJVM(cmd *Cmd) {...} 





数 ? 





main () 函数 不 用 变 ， 重 写 starUJVM () 函 
代码 如 下 : 





func startJVM(cmd *Cmd) {£ 


cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
fmt.Printf("classpath:%v class:%v args:%v\n", 
cp, cmd.class, cmd.args) 


className := strings.Replace(cmd.class, ".", "/", -1) 
classData, _, err := cp.ReadClass(className) 
if err != nil { 
fmt.Printf("Could not find or load main class %s\n", cmd 
return 


fmt.Printf("class data:%v\n", classData) 


startJVM 〈) 先 打印 出 命令 行 参数 ， 然 后 读 取 
主 类 数据 ， 并 打印 到 控制 台 。 虽 然 还 是 无 法 真正 启 
动 Java 虚 拟 机 ， 不 过 相 比 第 1 章 ， 己 经 有 了 很 大 的 进 
步 。 打 开 命 令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 代 
但 : 





go install jvmgo\ch02 


编译 成 功 后 ， 在 D: \go\Wworkspace\bin 目 录 下 出 
现 ch02.exe 文 件 。 执 行 ch02.exe， 指 定好 -Xjre 选 项 和 
类 名 ， 束 可 以 把 class 文 件 的 内 容 打 印 出 来 。 虽 然 只 
是 一 堆 看 似 森 乱 无 章 的 数字 ， 但 成 束 感 还 是 会 油 然 
而 生 。 笔 者 的 测试 结果 如 图 2-1 所 示 。 





ebin>ch02 -Xijre “C:\Program Files\Java\idkl. 8.0 66\jre” java. lang 


ce\bin class: javs ct args: 
190 0 0 78 3 6 S80383804210 
0 41 73 10 20 40 41 76 106 - 97 0 47 79 9 06 101 99 1 


16 59 10 20 40 76 106 97 1 47 10: 97 3 116 114 105 110 103 
5b59 103 4041861021 40 73 41 76 106 97 118 f 97 110 103 47 83 116 
14 105 110 103 59 ; 0440 744188105 40 74 7 {3 86 1 0 21 40 76 106 97 

97 47 108 97 110 103 47 79 98 106 101 99 116 59 41 90 1 0 21 40 76 106 97 118 9 
7 47 108 97 110 103 47 83 116 114 105 110 103 59 41 86 1 0 8 60 99 108 105 110 





图 2-1 ch02.exe 的 测试 结果 


2.5 ”本 章 小 结 


本 和 章 讨论 了 Java 虚 拟 机 从 哪里 寻找 class 文 件 ， 
对 类 路 径 和 -classpath 命 令 行 选项 有 了 较为 深入 的 了 
解 ， 并 且 把 抽象 的 类 路 径 概念 转变 成 了 具体 的 代 
码 。 下 一 章 将 研究 class 文 件 格式 ， 实 现 class 文 件 解 


析 。 


第 3 章 ”解析 class 文 件 


第 2 章 介 绍 了 Java 虚 拟 机 从 哪里 搜索 class 文 件 ， 
并 且 实 现 了 类 路 径 功能 ， 已 经 可 以 把 class 文 件 读 取 


到 内 存 中 。 本 章 将 详细 讨论 class 文 件 格式 ， 编 写 代 
码 解 析 class 文 件 ， 为 下 一 步 真 正 实现 Java 虚 拟 机 做 
好 准备 。 


在 开始 阅读 本 章 之 前 ， 先 把 目录 结构 准备 好 。 
复制 ch02 目 录 ， 并 改名 为 ch03， 然 后 编辑 
ch03\main.go 等 文件 ， 把 import 语 和 句 中 的 ch02 都 改 成 
ch03 1 ， 最 后 在 ch03 目 录 中 创建 classfile 子 目录 。 现 
在 的 目录 结构 看 起 来 应 该 如 下 所 示 : 


D:\go\workspace\src 
| -jvmgo 
|-cho1 
| -cho2 
| -ch03 


-classfile 
-classpath 
-cmd.go 
-main.go 


[ 这 个 过 程 比较 无 超 ， 也 容易 出 错 。 可 以 使 用 编辑 
器 提供 的 “搜索 和 替换 ”功能 来 完成 这 项 工作 。 


3.1 _ class 文件 


作为 类 (或 者 接口 ) 山 信 息 的 载体 ， 每 个 
class 文 件 都 完整 地 定义 了 一 个 类 。 为 了 使 Java 程 序 
可 以 “编写 一 次 ， 处 处 运行 ”，Java 虚 拟 机 规范 对 
class 文 件 格 式 进行 了 严格 的 规定 。 但 是 为 一 方面 ， 
对 于 从 哪里 加 载 class 文 件 ， 给 了 足够 多 的 目 由 。 由 
第 2 章 可 知 ，Java 虚 拟 机 实现 可 以 从 文件 系统 读 取 和 
从 JAR《 或 ZIP) 压缩 包 中 提取 class 文 件 。 除 此 之 
外 ， 也 可 以 通过 网 络 下 载 、 从 数据 库 加 载 ， 甚 至 是 
在 运行 中 直接 生成 class 文 件 。Java 虚 拟 机 规范 (和 
本 书 ) 中 所 指 的 dass 文 件 ， 并 非特 指 位 于 磁盘 中 
的 .class 文 件 ， 而 是 泛 指 任何 格式 符合 规范 的 class 数 
据 。 








构成 class 文 件 的 基本 数据 单位 是 字 节 ， 可 以 把 
整个 class 文 件 当 成 一 个 字 节 流 来 处 理 。 稍 大 一 些 的 
数据 由 连续 多 个 字 节 构成 ， 这 些 数据 在 class 文 件 中 
以 大 端 〈big-endian ) 方式 存储 。 为 了 描述 class 文 件 
格式 ，Java 虚 拟 机 规范 定义 了 ul1、u2 和 u4 三 种 数据 
类 型 来 表示 1、2 和 4 字 贡 无 符号 整数 ， 分 别 对 应 Go 
语言 的 uint8、uint16 和 uint32 类 型 。 相 同类 型 的 多 条 
数据 一 般 按 表 〈table) 的 形式 存储 在 class 文 件 中 。 
表 由 表 头 和 表 项 (item) 构成 ， 表 头 是 u2 或 u4 整 
数 。 假 设 表 头 是 n， 后 面 就 紧 跟 着 n 个 表 项 数据 。 




















Java 虚 拟 机 规范 使 用 一 种 类 似 C 语 言 的 结构 体 
语法 来 描述 class 文 件 格式 。 整 个 class 文 件 被 描述 为 
一 个 ClassFile 结 构 ， 代 码 如 下 : 


ClassFile { 
U4 magic 
U2 minor_version; 


U2 major_version,; 


U2 constant_pool_ count; 

cp_info constant_pool[constant_pool_ count-1]; 
U2 access_flags,; 

U2 this_class; 

U2 super_class,; 

U2 interfaces_count; 

U2 interfaces[interfaces_count]; 
U2 fields count,; 

field_info fields[fields_ count]; 

U2 methods_count 

method_info methods[methods_count]; 

U2 attributes_count,; 
attribute_info attributes[attributes_ count]; 


JDK 提 供 了 一 个 功能 强大 的 命令 行 工 具 javap， 
可 以 用 它 反 编译 class 文 件 。 不 过 从 控制 台 观 察 javap 
的 输出 并 不 是 很 直观 ， 因 此 笔者 用 JavaFX 编 写 了 一 
个 图 形 化 的 工具 ， 叫 作 classpy。 有 兴趣 的 读者 可 以 
去 GitHub 网 站 (下 载 classpy 的 源 代 码 或 者 打包 好 
的 JAR 可 执行 文件 。 后 面 的 小 节 中 将 以 ClassFileTest 
类 为 例 ， 使 用 classpy 程 序 分 析 class 文 件 格式 。 
ClassFileTest 的 代码 如 下 : 








package jvmgo,book ,cho3 


public class ClassFileTest { 
public static 
public static 
public static 
public static 
public static 
public static 
public static 
public static 
public static 


} 


System.out. 


final 
final 
final 
final 
final 
final 
final 
final 


boolean FLAG = true; 

byte BYTE = 123; 

char X= 'X'， 

Short SHORT = 12345; 

int INT = 123456789; 

long LONG = 12345678901L; 
float PI = 3.14f; 

double E = 2.71828; 


void main(String[] args) throws RuntimeExcept 
println("Hello, World!"); 





[1] 本 章 后 面 提 到 的 类 ， 如 无 特别 说 明 ， 均 泛 指 类 或 
者 接口 。 
[2] https:/ /github.com/zxh0/classpyo 


3.2 ”解析 class 文 件 


本 而 将 一 边 讨 论 class 文 件 格式 ， 一 边 编 写 代 码 
实现 class 文 件 解析 。Go 语 言 内 置 了 丰 旦 的 数据 类 
型 ， 非 钊 适合 处 理 class 文 件 。 为 了 便于 读者 参考 ， 
表 3-1 给 出 了 Go 和 Java 语 言 基 本 数据 类 型 对 照 ; 


系 。 在 第 4 章 中 还 会 继续 讨论 Java 数 据 关 型 。 





表 3-1 Go 和 Java 语 言 基 本 数据 类 型 对 照 关 系 














Go 语言 类 型 Java 语言 类 型 说 明 
int8 byte 8 比特 有 符号 整数 
uint8 (别名 byte) N/A 8 比特 无 符号 整数 
int16 short 16 比特 有 符号 整数 
uint16 char 16 比特 无 符号 整数 
int32 (别名 rune) int 32 比特 有 符号 整数 
uint32 N/A 32 比特 无 符号 整数 
int64 long 64 比特 有 符号 整数 
( 续 ) 
Go 语言 类 型 Java 语言 类 型 说 明 





64 比特 无 符号 整数 











uint64 N/A 
float33 float 32 比特 IEEE-754 浮 点 数 
float64 double 


64 比特 IEEE-754 浮 点 数 


3.2.1 读 取 数据 


解析 class 文 件 的 第 一 步 是 从 里 面谈 取 数 据 。 虽 
然 可 以 把 dass 文 件 当成 字 节 流 来 处 理 ， 但 是 直接 操 
作 字 节 很 不 方便 ， 所 以 先 定义 一 个 结构 体 来 帮助 读 
取 数 据 。 在 ch03\classfile 目 录 下 创建 class_reader.go 
文件 ， 在 其 中 定义 ClassReader 结 构 体 和 数据 读 取 方 
法 ， 代 码 如 下 : 








package classfile 
import "encoding/binary" 
type ClassReader struct { 

data [lbyte 
} 
func (self *ClassReader) readUint8() uint8 {...} // ul 
func (self *ClassReader) readUint16() uint16 {...} // u2 
func (self *ClassReader) readUint32() uint32 {...} // u4 
func (self *ClassReader) readUint64() uint64 {...} 
func (self *ClassReader) readUint1i6s() []uint16 {...} 
func (self *ClassReader) readBytes(length uint32) [J]byte {...} 





ClassReader 只 是 []byte 类 型 的 包装 而 已 。 


readUint8 〈) 读 取 ul 类 型 数据 ， 代 人 码 如 下 : 


func (self *ClassReader) readUint8() uint8 { 
val := Self,data[o0] 
self.data = Self.data[1:] 
return val 


让 











注意 ，ClassReader 并 没有 使 用 索引 记录 数据 位 
置 ， 而 是 使 用 Go 语言 的 reslice 语 法 跳 过 已 经 读 取 的 
数据 。readUint16 〈) 读 取 u2 类 型 数据 ， 代 码 如 
i 


func (self *ClassReader) readUint16() uint16 { 
val := binary.BigEndian.Uint16(self.data) 
self.data = self.data[2:] 
return val 


Go 标准 库 encoding/binary 包 中 定义 了 一 个 变量 
BigEndian， 正 好 可 以 从 []byte 中 解码 多 字 市 数据 。 
readUint32 〈) 读 取 u4 类 型 数据 ， 代 人 码 如 下 : 


func (self *ClassReader) readUint32() uint32 { 
val := binary.BigEndian.Uint32(self.data) 
self.data = self.data[4:] 
return val 


} 





readUint64 〈) 读 取 uint64 (Java 虚 拟 机 规范 并 
没有 定义 u8)〉 类 型 数据 ， 代 码 如 下 : 





func (self *ClassReader) readUint64() uint64 { 
val := binary.BigEndian.Uint64(self.data) 
self.data = self.data[8:] 
return val 


} 





readUint16s ( ) 读 取 uint16 表 ， 表 的 大 小 由 开 
头 的 uint16 数 据 指 出 ， 代 码 如 下 : 





func (self *ClassReader) readUint1i6s() []uint16 { 
n := self.readUint16() 
s := make([]uint16, n) 
for i := range s { 
s[i] = self.readUint16() 


return s 


} 








最 后 一 个 方法 是 readBytes () ， 用 于 读 取 指定 


数量 的 字 节 ， 代 码 如 下 : 





func (self *ClassReader) readBytes(n uint32) [lbyte { 
bytes := self.data[:n] 
self.data = self.dataln:] 
return bytes 


3.2.2 ”整体 结构 


有 了 ClassReader， 可 以 开始 解析 class 文 件 了 。 
在 ch03\classfile 目 录 下 创建 class_file.go 文 件 ， 在 其 
中 定义 ClassFile 结 构 体 ， 代 人 码 如 下 : 


package classfile 
import "fmt" 
type ClassFile struct { 


//magic uint32 
minorVersion uint16 
majorVersion uint16 
constantPool ConstantPool 
accessFlags uint16 
thisClass uint16 
superClass uint16 
interfaces [juint16 
fields []*MemberInfo 
methods []*MemberInfo 
attributes []AttributeInfo 


ClassFile 结 构 体 如 实 反 映 了 Java 虚 拟 机 规范 定 
义 的 class 文 件 格式 。 还 会 在 class_file.go 文 件 中 实现 
一 系列 函数 和 方法 ， 列 举 如 下 : 


func Parse(classData [lbyte) (cf *CclassFile, err error) {...} 
func (self *ClassFile) read(reader *ClassReader) {...} 

func (self *ClassFile) readAndCheckMagic(reader *ClassReader) 
func (self *ClassFile) readAndCheckVersion(reader *ClassReader 
func (self *ClassFile) MinorVersion() uint16 {...} // getter 
func (self *ClassFile) MajorVersion() uint16 {...} // getter 
func (self *ClassFile) ConstantPool() ConstantPool {...} // ge 
func (self *ClassFile) AccessFlags() uint16 {...} // getter 
func (self *ClassFile) Fields() []*MemberInfo {...} // getter 
func (self *ClassFile) Methods() []*MemberInfo {...} // getter 
func (self *ClassFile) ClassName() string {...} 

func (self *ClassFile) SuperClassName() string {...} 

func (self *ClassFile) InterfaceNames() [jstring {...} 





相 比 Java 语 言 ，Go 的 访问 控制 非常 简单 : 只 有 
公开 和 私有 两 种 。 所 有 表 字 母 大 与 的 关 型 、 结 构 
体 、 字 段 、 变 量 、 图 数 、 方 法 等 都 是 公开 的 ， 可 供 
其 他 包 使 用 。 首 字母 小 写 则 是 私有 的 ， 只 能 在 包 拓 
部 使 用 。 在 本 书 的 代码 中 ， 尽 量 只 公开 必要 的 变 
量 、 字 段 、 函 数 和 方法 等 。 但 是 为 了 提高 代码 可 读 
性 ， 所 有 的 结构 体 都 是 公开 的 ， 也 就 是 首 字母 是 大 
ok 

















Parse () 六 数 把 [Jbyte 解 析 成 ClassFile 结 构 


体 ， 代 码 如 下 : 





func Parse(classData [|]byte) (cf *ClassFile, err error) { 
defer func() { 
if r := recover(); r != nil { 
var ok bool 
err ok = r.(error) 
if !ok { 
err = fmt.Errorf("%v", r) 


4 
l 
}() 


cr := &ClassReader{classData} 
cf = &ClassFilef{} 

cf.read(cr) 

return 





Go 语言 没有 异常 处 理 机 制 ， 只 有 一 个 panic- 
recover 机 制 。read () 方法 依次 调用 其 他 方法 解析 
class 文 件 ， 代 码 如 下 : 





func (self *ClassFile) read(reader *ClassReader) { 
self.readAndCheckMagic(reader) // 见 


3.2.3 
self.readAndCheckVersion(reader) // 见 


3.2.4 
self.constantPool = readConstantPool(reader) // 见 


self.accessFlags = reader.readUint16() 

self.thisClass = reader.readUint16() 

self.superClass = reader.readUint16() 

self.interfaces = reader.readUint16s() 

self.fields = readMembers(reader, self.constantPool) // 见 


self.methods = readMembers(reader, self.constantPool) 
self.attributes = readAttributes(reader, self.constantPool) 





MajorVersion〈 ) 等 6 个 方法 是 Getter 方 法 ， 把 
结构 体 的 字段 骏 露 给 其 他 包 使 用 。 
MajorVersion () 的 代码 如 下 : 





func (self *ClassFile) MajorVersion() uint16 { 
return self.majorVersion 





和 Java 有 所 不 同 ，Go 的 Getter 方 法 不 以 “get” 开 
头 。 由 于 Getter 方 法 非常 简单 ， 只 是 返回 字段 而 
己 ， 为 了 节约 扁 幅 ， 后 文中 不 再 给 出 Getter 方 法 的 





代码 。CjlassName 〈) 从 常量 池 查 找 类 名 ， 代 码 如 





func (self *ClassFile) ClassName() string { 
return self.constantPool.getClassName(self.thisClass) 





SuperClassName 〈() 从 第 量 池 答 找 超 类 名 ， 代 
人 码 如 下 : 





func (self *ClassFile) SuperClassName() string { 
If self.superClass > 0f 
return self.constantPool.getClassName(self.superClass) 


return ""” // 只 有 


java.lang.0bject 没 有 起 类 





InterfaceNames 〈) 从 和 负 量 池 碍 找 接口 名 ， 代 
人 码 如 下 : 





func (self *ClassFile) InterfaceNames() [jstring { 
interfaceNames := make([]string, len(self.interfaces)) 
for i, cpIndex := range self.interfaces { 
interfaceNames[i] = self.constantPool.getClassName(cpInd 


return interfaceNames 


》 





下 面 详细 介绍 class 文 件 的 各 个 部 分 (常量 池 和 
属性 表 比 较 复 杂 ， 放 到 3.3 和 3.4 节 单独 讨论 ) 


3.2.3 ” 魔 数 


很 多 文件 格式 都 会 规定 满足 该 格式 的 文件 必须 
以 某 几 个 固定 字 节 开头 ， 这 几 个 字 节 主要 起 标识 作 
用 ， 叫 作 魔 数 (magic number) 。 例 如 PDF 文件 以 4 
字 节 “%PDF”(0x25、0x50、0x44、0x46) 开头 ， 
ZIP 文 件 以 2 字 节 “PK”(0x50、0x4B)〉 开头 。class 文 
件 的 魔 数 是 “0xCAFEBABE”。 
readAndCheckMagic() 方法 的 代码 如 下 : 


func (self *ClassFile) readAndCheckMagic(reader *ClassReader) 
magic := reader.readUint32() 
If magic != 0XCAFEBABE { 
panic("java.lang.ClassFormatError: magic!") 


Java 虚 拟 机 规范 规定 ， 如 果 加 载 的 class 文 件 不 
符合 要 求 的 格式 ，Java 虚 拟 机 实现 就 抛 出 





java.lang.ClassFormatError 寞 常 。 但 是 因为 我 们 才刚 
刚 开始 编写 虚拟 机 ， 还 无 法 抛 出 异常 ， 所 以 暂时 先 
调用 panic() 方法 终止 程序 执行 。 用 classpy 打 开 
ClassFileTest.class 文 件 ， 可 以 看 到 ， 开 头 4 字 节 确实 
是 0xCAFEBABE， 如 图 3-1 所 示 。 


ClassFileTest.Cclas5 X 


v ClassFileTest.class 0000] ER O00 00 00 34 00 4i 


0 0 zx 00 06 00 31 09 

magic: Oxcafebabe 00101 00 32 00 33 08 00 34 OA 00 35 00 36 07 00 37 07 

0020 3 如 1 0004 a4€ 4 1 47 O01 sn (0 )( T 

人 Ud UU 2 2 WA 2 DO Ss 党 上 二 2 二 WW /和 J 2 J U2 
minorVersion:; 0 : : a ” 过 E PE 
10030 43 6F Rar! 时 E 4 5 《 





majorVersion: 52 


图 3-1 用 classpy 观 察 魔 数 


3.2.4 ”版 本 号 


魔 数 之 后 是 class 文 件 的 次 版 本 号 和 主 版 本 号 ， 
都 是 u2 类 型 。 假 设 某 class 文 件 的 主 版 本 号 是 M， 次 
版 本 号 是 m， 那 么 完整 的 版 本 号 可 以 表示 
成 “M.m”* 的 形式 。 次 版 本 写 只 在 J2SE 1.2 之 前 用 
过 ， 从 1.2 开 始 基本 上 就 没什么 用 了 “都 是 0) 。 主 
版 本 号 在 J2SE 1.2 之 前 是 45， 从 1.2 开 始 ， 每 次 有 大 
的 Java 版 本 发 布 ， 都 会 加 1。 表 3-2 列 出 了 到 本 书写 
作为 止 ， 使 用 过 的 class 文 件 版 本 号 。 


表 3-2 class 文 件 版 本 号 











Java 版 本 class 文件 版 本 号 Java 版 本 class 文件 版 本 号 
JDK 1.0.2 45.0 ~ 45.3 Java SE $5.0 49.0 

JDK 1.1 45.0 ~ 45.65535 Java SE6 $50.0 

J2SE 1.2 46.0 Java SE7 $51.0 
J2SE3d.3 47.0 JavaSE 8 S2.0 

J2SE 1.4 48.0 














特定 的 Java 虚 拟 机 实现 只 能 文 持 版 本 号 在 某 个 
范围 内 的 class 文 件 。Oracle 的 实现 是 完全 向 后 兼容 
的 ， 比 如 Java SE 8 文 持 版 本 写 为 45.0~52.0 的 class 文 
件 。 如 果 版 本 号 不 在 支持 的 范围 内 ，Java 虚 拟 机 实 
现 就 抛 出 java.lang.UnsupportedClassVersionError 异 
常 。 我 们 参考 Java 8， 文 持 版 本 号 为 45.0~52.0 的 
class 文 件 。 如 果 遇 到 其 他 版 本 号 ， 和 暂时 先 调用 
panic() 方法 终止 程序 执行 。 下 面 是 
readAndCheckVersion 〈) 方法 的 代码 。 














func (self *ClassFile) readAndCheckVersion(reader *ClassReader 
self.minorVersion = reader.readUint16() 
self.majorVersion = reader.readUint16() 
switch self.majorVersion { 


case 45: 
return 
case 46, 47, 48, 49, 50, 51, 52: 
if self.minorVersion == © { 
return 
} 


panic("java.lang.UnsupportedclassVersionError!") 


为 笔者 使 用 JDK8 编 译 ClassFileTest 类 ， 所 以 
主 版 本 号 是 52 (0x34) ， 次 版 本 号 是 0， 如 图 3-2 所 
Ne 


QlassFileTest .class Xx 


v ClassFileTest.class J000| CR FE BA BE 00 00 903 00 40 OA 00 06 00 31 09 
magic: Oxcafebabe 0010| 00 32 00 33 08 00 34 0A 00 35 00 36 07 00 37 07 
minorVersion- 0 0020 | 00 38 01i 00 04 4€ 区 1 #70 00.01 5A 644 D 

0030| 43 6€F 6E 73 74 €1 6E 74 56 61 6C 75 65 03 ) 
majorVersion; 52 0040| 00 01 01 00 04 42 59 54 45 01 0 1 42 03 : 
constantPoolCount-: 64 0050| 00 7B 01 01 58 01 00 01 43 0 ) 00 00 1 





图 3-2 ”用 classpy 观 察 版 本 号 


3.2.5 类 访问 标志 





版 本 写 之 后 是 常量 池 ， 但 是 由 于 常量 池 比 较 复 
杂 ， 所 以 放 到 3.3 节 介绍 。 常 量 池 之 后 是 类 访问 标 


志 ， 这 是 一 个 16 位 的 “bitmask”， 指 出 class 文 件 定义 


~ 


Es 


是 类 还 是 接口 ， 访 问 级 别 是 public 还 是 private， 等 
。 本 章 只 对 class 文 件 进行 初步 解析 ， 并 不 做 完整 
验证 ， 所 以 只 是 谈 取 类 访问 标志 以 备 后 用 。 第 6 章 
会 详细 讨论 访问 标志 。ClassFileTest 的 类 访问 标志 


是 0x21， 如 图 3-3 所 示 。 


上 





ClassFileTest .class X 


constantPoolCount 64 0230|] é€A 61 36 61 2F €9 6F 2F 50 72 €9 6E 7< 




















图 3-3 ”用 classpy 观 察 类 访问 标志 


3.2.6 ”类 和 超 类 索引 


类 访问 标志 之 后 是 两 个 u2 类 型 的 沼 量 池 索 引 ， 
分 别 给 出 类 名 和 超 类 名 。class 文 件 存储 的 类 名 类 似 
完全 限定 名 ， 但 是 把 点 换 成 了 斜 线 ，Java 语 言 规范 
把 这 种 名 字 叫 作 二 进 制 名 (binary names) 。 因 为 
每 个 类 都 有 名 字 ， 所 以 thisClass 必 须 是 有 效 的 常量 
池 索 引 。 除 java.lang.Object 之 外 ， 其 他 类 都 有 起 
类 ， 上 所 以 superClass 只 在 Object.class 中 是 0， 在 其 他 
class 文 件 中 必须 是 有 效 的 第 量 池 索引 。 如 图 3-4 所 


示 ，ClassFileTest 的 类 索引 是 5， 超 类 索引 是 6。 


ClassFileTest class X 
bp constantPooI < 所 用 25 二 本 和 
accessFlags: ACC_PUBLIC, ACC_SUPER 2501 28 4C 6A 61 76 61 2F 6c 61 6E 67 
thisClass: #5->jvymgo/book/ch03/ClassFileTest J260 6E 67 3B 29 56 00 21 Does 00 06 
270 9 00 07 00 08 00 01 00 09 00 00 


superClass; #6->java/lang/Object J270| 19 00 07 00 08 00 01 


3280| 19 00 0B 00 0c 006 01 090 99 00 00 
70ON| 19 NN 人 nn 0 nf NY NN N99 NN AN 


图 3-4 ”用 classpy 观 察 类 和 超 类 索引 


interfacesCount: 0 


3.2.7 接口 索引 表 


类 和 超 类 索引 后 面 是 接口 索引 表 ， 表 中 存放 的 
也 是 常量 池 索 引 ， 给 出 该 类 实现 的 所 有 接口 的 名 
字 。ClassFileTest 没 有 实现 接口 ， 所 以 接口 表 是 空 
的 ， 如 图 3-5 所 示 。 


ClassFileTest.class X 

MC No 本 
| > D 0!} | 2 69 6E 4 6C 6E O01 YO 1 

superClass: #6->java/lant |h2s0| 28 4C €A 61 76 61 2F 6€6C 6€1 6E 67 2F 53 74 72 69 

interfacesCount- 0 )2601 6P 67 3B 29 56 00 21 00 05 00 06 OIGYg 00 08 00 

interfaces 270 19 00 O07 O00 08 O00 0 00 09 00 00 00 02 00 OA 00 
有 门 © i 0B ¢ 0 O00 O00 00 02 NN 

fieldsCount: 8 





Nn | 


图 3-5 ”用 classpy 观 察 接口 索引 表 


3.2.8 字段 和 方法 表 


接口 索引 表 之 后 是 字段 表 和 方法 表 ， 分 别 存储 
字段 和 方法 信息 。 字 段 和 方法 的 基本 结构 大 致 相 
同 ， 开 列 仅 在 于 属性 表 。 下 和 面 是 Java 虚 拟 机 规范 给 
出 的 字段 结构 定义 。 








field info { 


U2 access_flags,; 

U2 name_index; 

U2 descriptor_index; 

U2 attributes count; 
attribute_info attributes[attributes_ count]; 


和 类 一 样 ， 字 上 段 和 方法 也 有 上 自己 的 访问 标志 。 
访问 标志 之 后 古 一 个 当量 池 索 引 ， 给 出 字段 名 或 方 
法 名 ， 然 后 义 古 一 个 常量 池 索 引 ， 给 出 字段 或 方法 
的 描述 符 ， 最 后 是 属性 表 。 为 了 避免 重复 代码 ， 用 











一 个 结构 体 统一 表示 字段 和 方法 。 在 ch03\classfile 
目录 中 创建 member_info.go 文 件 ， 在 其 中 定义 
MemberInfo 结 构 体 ， 代 码 如 下 : 





package classfile 
type MemberInfo Struct { 


cp ConstantPool 

accessFlags uint16 

nameIndex uint16 

descriptorIindex uint16 

attributes []AttributeInfo 
} 
func readMembers(reader *ClassReader, cp ConstantPool) [1]*Memb 
func readMember(reader *ClassReader, cp ConstantPool) *MemberI 
func (self *MemberInfo) AccessFlags() uint16 {...} // getter 
func (self *MemberInfo) Name() string {...} 
func (self *MemberInfo) Descriptor() string {...} 





cp 字段 保存 常量 池 指 针 ， 后 面 会 用 到 它 。 
readMembers 〈) 读 取 字段 表 或 方法 表 ， 代 人 码 如 


下 : 





func 


readMembers(reader *ClassReader, cp ConstantPool) []*Memb 


memberCount := reader.readUint16() 
members := make([]*MemberInfo, memberCount) 


fo 


} 


re 


ri := range members { 
members[I] = readMember(reader, cp) 


turn members 








readMember 〈) 函数 读 取 字段 或 方法 数据 ， 代 
公 如 下 : 





func readMember(reader *ClassReader, cp ConstantPool) *MemberI 
return &MemberInfof{ 


cp: cp, 

accessFlags: reader .readUint16(), 

nameIndex: reader .readUint16(), 
descriptorIindex: reader .readUint16(), 

attributes: readAttributes(reader, cp), // 见 





属性 表 和 readAttributes () 函数 将 在 3.4 节 介 
绍 。Name〈() 从 币 量 池 奏 找 字 段 或 方法 名 ， 
Descriptor () 从 第 量 池 碍 找 字 段 或 方法 摘 述 符 ， 代 
人 码 如 下 : 











func (self *MemberInfo) Name() string { 
return self.cp.getUtf8(self.nameIndex) 


func (self *MemberInfo) Descriptor() string { 


return Self.cp.getUtf8(Sself,descriptorIndex ) 





第 6 章 会 进一步 讨论 字段 和 方法 。ClassFileTest 
有 8 个 字段 和 两 个 方法 (其 中 <init> 是 编译 器 生成 的 
默认 构造 函数 ) ， 如 图 3-6 和 图 3-7 所 示 。 


ClassFileTest.class X 
interfaces 
fieldsCount: 8 


v #0: FLAG 


accessFlags: ACC_PUBLIC, ACC_STATIC, ACC_FINAL 
namelndex: #7->FLAG 
descriptorindex' #8->Z 
attributesCount: 1 
> attributes 
> #1: BYTE 








iN2mN1 N37 nn ni nn 


图 3-6 ”用 classpy 观 察 字段 表 


| 


» fields )02c01 19 00 17 00 18 00 01 00 09 00 

methodsCount: 2 Yo2D0| 19 00 1B 00 1c 00 01 00 09 00 
ho2E0| 19 00 1E 00 iF 00 01 00 09 00 
)02F0 | ) 01 00 22 00 23 00 01 00 






bp #0: <init> 
v #1: main 
accessFlags: ACC_PUBLIC, ACC_STATIC 


namejindex- #41->main 
descriptorindex: #42->([{Liava/lang/String;)V 
attribUtesCount: 2 


| 
A 
| 
| 


2F 00 00 00 02 00 30 





)0380| 








> attributes 
attributesCount: 1 
b> attributes =) ] 


图 3-7 用 classpy 观 察 方 法 表 


3.3 ”解析 和 销量 字 


音量 池 占 据 了 class 文 件 很 大 一 部 分 数据 ， 里 面 
存放 大 各 陈 各 样 的 名 量 信息 ， 包 括 数 字 和 字符 串 亲 
量 、 类 和 接口 名 、 字 段 和 方法 名 ， 等 等 。 本 节 将 详 


细 介 绍 第 量 池 和 各 种 常量 。 








3.3.1 ”ConstantPool 结 构 体 


在 ch03\classfile 目 录 下 创建 constant_pool.go 文 
件 ， 在 里 面 定义 ConstantPool 类 型 ， 代 人 码 如 下 所 


一 


和 修 : 





package classfile 

type ConstantPool []ConstantIinfo 

func readConstantPool(reader *ClassReader) ConstantPool {...} 
func (self ConstantPool) getConstantIinfo(index uint16) Constan 
func (self ConstantPool) getNameAndType(index uint16) (string, 
func (self ConstantPool) getClassName(index uint16) string {.. 
func (self ConstantPool) getUtf8(index uint16) string {...} 








第 量 池 实 际 上 也 是 一 个 表 ， 但 是 有 三 点 需要 特 
别 注意 。 第 一 ， 表 头 给 出 的 党 量 池 大 小 比 实际 大 
1。 假 设 表 头 给 出 的 值 是 na， 那么 常量 池 的 实际 大 小 
是 n-1。 第 二 ， 有 效 的 常量 池 索引 是 1~n-1。0 古 无 
效 索 引 ， 表 示 不 指 同 任何 常量 。 第 三 ， 





CONSTANT_Long_info 和 CONSTANT_Double _info 
各 占 两 个 位 置 。 也 就 是 说 ， 如 果 和 音量 池 中 存在 这 两 
种 音量 ， 实 际 的 常量 数量 比 n-1 还 要 少 ， 而 且 1~n-1 
的 某 些 数 也 会 变 成 无 效 索 引 。 第 量 池 由 
readConstantPool 〈) 函数 谈 取 ， 代 码 如 下 : 








func readConstantPool(reader *ClassReader) ConstantPool { 
cpCount := int(reader.readUint16()) 
cp := make([]ConstantIinfo, cpCount) 
for i := 1; i < cpCount; i++ { // 注意 索引 从 


1 开始 


cp[i] = readConstantIinfo(reader, cp) 

Switch cp[i].(type) { 

case *ConstantLongInfo, *ConstantDoubleInfo: 
I++ // 占 两 个 位 置 


} 
上 


return cp 


} 





getConstantInfo 〈) 方法 按 索 引得 找 单 量 ， 代 


人 码 如 下 : 





func (self ConstantPool) getConstantIinfo(index uint16) Constan 
if cpInfo := self[index]; cpInfo != nil { 
return cpInfo 
} 
panic("Invalid constant pool index!") 


3 





getNameAndType 〈) 方法 从 名 量 池 碍 找 字 段 
或 方法 的 名 字 和 摘 述 符 ， 代 码 如 下 : 





func (self ConstantPool) getNameAndType(index uint16) (string, 
ntInfo := self.getConstantIinfo(index).(*ConstantNameAndType 
name := self.getUtf8(ntIinfo.nameIndex) 
_type := self.getUtf8(ntIinfo.descriptorIindex) 
return name, _type 





getClassName 〈) 方法 从 和 常量 池 仁 找 类 名 ， 代 
人 码 如 下 : 





func (self ConstantPool) getClassName(index uint16) string { 
classInfo := self.getConstantInfo(index).(*ConstantClassInf 
return self.getUtf8(classIinfo.nameIndex) 


上 


Peer 


getUtf8〈) 方法 从 常量 池 查 找 UTF-8 字 符 串 ， 
代码 如 下 : 





func (self ConstantPool) getUtf8(index uint16) string { 
utf8Info := self.getConstantInfo(index).(*ConstantUtf8Info) 
return utf8Info.str 





ClassFileTest 的 常量 池 大 小 是 61 如 图 3-8 所 示 。 


| | ClassFileTest.class X 
| 





v ClassFileTest.class 000| CA FE BA BE 00 00 00 34 BH oA 00 06 00 31 09 
magic: Oxcafebabe 01 00 32 00 33 08 00 34 0A 00 35 00 36 07 00 37 07 
majorVersion; 32 040| 00 01 01 00 04 42 59 54 45 01 00 01 42 03 00 00 

To5ol oo 75 01 00 01 58 01 00 01 43 03 00 00 00 58 01 | 
| Pb constantPool 4 = 5 a eg 3 Es A 和 人 > 2 3 


图 3-8 ”用 classpy 观 察 常 量 池 大 小 


3.3.2 ”ConstantInfo 接 口 





由 于 常量 池 中 存放 的 信息 各 不 相同 ， 所 以 每 种 
当量 的 格式 也 不 同 。 管 量 数据 的 第 一 字 市 是 tag， 用 
来 区 分 常量 类 型 。 下 面 是 Java 虚 拟 机 规范 给 出 的 常 


量 结构 。 





cp_info { 
ul1 tag ， 
ui info[]; 


Java 虚 拟 机 规范 一 共 定 义 了 14 种 常量。 在 
ch03\classfile 目 录 下 创建 constant_info.go 文 件 ， 在 其 
中 定义 tag 第 量 值 ， 代 码 如 下 : 


package classfile 
// tag 常 量 值 定义 


const ( 


CONSTANT_Class 
CONSTANT_Fieldref 
CONSTANT_Methodref 
CONSTANT_InterfaceMethodref 
CONSTANT_String 
CONSTANT_Integer 
CONSTANT_Float 
CONSTANT_Long 
CONSTANT_Double 
CONSTANT_NameAndType 
CONSTANT_Utf8 
CONSTANT_MethodHandle 
CONSTANT_MethodType 
CONSTANT_InvokeDynamic 


© 


PPONRRCVWOPPON 





继续 编辑 constant_pool.go， 定 义 ConstantInfo 接 








type ConstantInfo interface { 
readIinfo(reader *ClassReader) 


func readConstantIinfo(reader *ClassReader, cp ConstantPool) Co 
func newConstantIinfo(tag uint8, cp ConstantPool) ConstantInfo 








readInfo () 方法 读 取 常量 信息 ， 需 要 由 具体 
的 常量 结构 体 实现 。readConstantInfo() 函数 先 读 
出 tag 值 ， 然 后 调用 newConstantInfo () 函数 创建 具 
体 的 音量， 最 后 调用 常量 的 readInfo() 方法 读 取 














常量 言 妃 》 代码 如 下 。 





func readCconstantInfo(reader *ClassReader, cp ConstantPool) Co 
tag := reader.readUint8() 
Cc := newConstantInfo(tag, cp) 
c.readIinfo(reader) 
return c 





newConstantInfo 〈) 根据 tag 值 创建 具体 的 第 
量 ， 代 人 码 如 下 : 





func newConstantIinfo(tag uint8, cp ConstantPool) ConstantInfo 

switch tag { 
case CONSTANT_Integer: return &ConstantIintegerInfo{} 
case CONSTANT_Float: return &ConstantFloatInfof{} 
case CONSTANT_Long: return &ConstantLongInfo{} 
case CONSTANT_Double: return &ConstantDoubleInfo{} 
case CONSTANT_Utf8: return &ConstantUtf8Info{} 
case CONSTANT_String: return &ConstantStringInfo{cp: cp} 
case CONSTANT_Class: return &ConstantClassInfo{cp: cp} 
case CONSTANT_Fieldref: 

return &ConstantFieldrefIinfo{ConstantMemberrefIinfo{cp: < 
case CONSTANT_Methodref: 

return &ConstantMethodrefIinfo{ConstantMemberrefInfo{cp: 
case CONSTANT_InterfaceMethodref : 

return &ConstantIinterfaceMethodrefInfo{ConstantMemberref 
case CONSTANT_NameAndType: return &ConstantNameAndTypeInfo{ 
case CONSTANT_MethodType: return &ConstantMethodTypeInfof{} 
case CONSTANT_ MethodHandle: return &ConstantMethodHandleInf 
case CONSTANT_InvokeDynamic: return &ConstantInvokeDynamicI 
default: panic("java.lang.ClassFormatError: constant pool t 








下 面 的 小 节 详细 介绍 各 种 常量 。 


3.3.3 CONSTANT_Integer_info 


CONSTANT_Integer_info 使 用 4 字 节 存储 整数 


音量 ， 其 结构 定义 如 下 : 





CONSTANT_Integer_info { 
ul1 tag,; 
U4 bytes; 

} 


CONSTANT_Integer_info 和 后 面 将 要 介绍 的 其 
他 三 种 数字 常量 无 论 是 结构 ， 还 是 实现 ， 都 非常 相 
似 ， 所 以 把 它们 定义 在 同一 个 文件 中 。 在 
ch03\classfile 目 录 下 创建 cp_numeric.go 文 件 ， 在 其 
中 定义 ConstantIntegerInfo 结 构 体 ， 代 码 如 下 : 








package classfile 

import "math" 

type ConstantIntegerInfo struct { 
val int32 


} 
func (self *ConstantIintegerIinfo) readIinfo(reader *ClassReader) 


readInfo 〈) 先 读 取 一 个 uint32 数 据 ， 然 后 把 它 
转型 成 int32 类 型 ， 代 码 如 下 : 





func (self *ConstantIntegerInfo) readIinfo(reader *ClassReader) 
bytes := reader.readUint32() 
self.val = int32(bytes) 

} 





CONSTANT_Integer_info 正 好 可 以 容纳 一 个 
Java 的 int 型 常量， 但 实际 上 比 int 更 小 的 boolean、 
byte、short 和 char 类 型 的 常量 也 放 在 
CONSTANT_Integer_info 中 。 编 译 器 给 ClassFileTest 
类 的 INT 字 段 生 成 了 一 个 CONSTANT_Integer_info 


音量 ， 如 图 3-9 所 示 。 





ClassFileTest.class X 
» #20 (Utf8): INT a eh HY EH | 
48 4F 01 00 01 53 03 00 00 30 39 | 
> #21 (UfS): | 0701 01 00 03 49 4E 00 01 49 ESEECDES ol | 
二 2ZUInEEOena 23356789 (080| 00 04 4C 4F 4E 00 01 4 05 00 00 00 02 DF | 
tag- 3 0901 DC 1c 35 01 02 50 49 01 00 01 46 04 40 48 FS | 
0A0| c3 01 00 01 45 01 00 01 44 06 40 05 BF 09 95 AA | 
bytes: 123456789 NN F7 90 NT On O06 3c 69 PP 69 74 3F NT NO 03 28 29 | 


图 3-9 ”用 classpy 观 罕 
spy 观 察 CONSTANT_Integer_info 常 量 


3.3.4 CONSTANT Float info 





CONSTANT_Float_info 使 用 4 字 节 存储 IEEE754 
单 精度 浮 点 数 常 量 ， 结 构 如 下 : 





CONSTANT_Float_info { 
ul1 tag,; 
U4 bytes; 

} 





在 cp_numeric.go 文 件 中 定义 ConstantFloatInfo 结 
构 体 ， 代 码 如 下 : 





type ConstantFloatIinfo Struct { 
val float32 


func (self *ConstantFloatIinfo) readIinfo(reader *ClassReader) { 
bytes := reader.readUint32() 
self.val = math.Float32frombits(bytes) 

} 





readInfo 〈) 先 读 取 一 个 uint32 数 据 ， 然 后 调用 


math 包 的 Float32frombits〈) 函数 把 它 转换 成 float32 
类 型 。 编 译 右 给 ClassFileTest 类 的 PI 字段 生成 了 一 


个 CONSTANT Float info 常 量 ， 如 图 3-10 所 示 。 





ClassFileTest.class X 

» #27 (Utf8): PI ~Doée0| 00 05 53 48 4F 52 54 0 01 53 03 00 00 38 39 | 
0701 01 00 03 49 4F 54 01 00 01 49 03 07 SB CD 15 01 | 

» #28 (Utf8)- F Pe Rs > 
| ct )0801 00 04 4C 4F 4E 47 01 00 01 4A 05 00 00 00 02 DF | 
| v #29 (Float): 3.14 )0901 DC 1c 35 01 00 02 50 49 01 00 01 46 O240 3080 
tag: 4 ES 01 00 01 45 01 00 01 44 06 40 05 BF 09 95 AA | 
JOBO| F7 90 01 00 06 3C 69 6E 69 74 3E 01 00 03 28 29 | 
bytes- 3.14 A EE ee 


图 3-10 ”用 classpy 观 察 CONSTANT _Float info 常 量 


3.3.5 CONSTANT_Long_info 





CONSTANT_Long_info 使 用 8 字 节 存储 整数 常 
量 ， 结 构 如 下 : 





CONSTANT_Long_info { 
UL tag ， 
u4 high_bytes; 
U4 low_bytes; 

} 





在 cp_numeric.go 文 件 中 定义 ConstantLongInfo 
结构 体 ， 代 码 如 下 : 





type ConstantLongInfo struct { 
val int64 


func (self *ConstantLongInfo) readIinfo(reader *ClassReader) { 
bytes := reader.readUint64() 
self.val = int64(bytes) 

} 





readInfo 〈) 先 读 取 一 个 uint64 数 据 ， 然 后 把 它 


转型 成 int64 类 型 。 编 译 器 给 ClassFileTest 类 的 LONG 
字段 生成 了 一 个 CONSTANT_Long_info 常 量 ， 如 图 


3-11 所 示 。 


ClassFileTest.class X 


Pp #23 (Utf8): LONG 
bp #24 (Urf8): J 


v #25 (Long): 12345678901 


tag: 5 四 


) js 
(人 


Di REG CD ~] ON Cn 
Le 
《 口 口 口 品 
2 二 和 一 
yc We 
nn 
0 
un 
J 
r 
D 
“> vo 
OD 请 
DO 
un 
DD 
mn, nN ~) 
On UDO 
OMWmwBrHoo 
[ws] OD 
ODO 
O 
iD 
UH 
Wh 


2 00 01 04 40 48 FS 
highBytes: Ox2 JAA0| C3 01 00 01 45 01 06 40 BF 09 93 AA 
- OBO| FT7 90 01 00 06 3C E 74 3E 00 03 28 29 
lowBytes: Oxdfdc1c35 c 56€ J4 43 6€F 64 65 01 00 OF 4C 69 6 65 4E 


图 3-11 用 classpy 观 察 CONSTANT_Long info 常 量 


3.3.6 CONSTANT Double info 


最 后 一 个 数字 常量 是 
CONSTANT_Double info， 使 用 8 字 节 存储 IEEE754 
双 精 度 浮 点 数 ， 结 构 如 下 : 








CONSTANT_Double info { 
u1 tag; 
u4 high_bytes; 
U4 low_bytes; 

} 





在 cp_numeric.go 文 件 中 定义 ConstantDoubleInfo 
结构 体 ， 代 码 如 下 : 





type ConstantDoubleInfo struct { 
val float64 


func (self *ConstantDoubleInfo) readIinfo(reader *ClassReader) 
bytes := reader.readUint64() 
self.val = math.Float64frombits(bytes) 


| 


二 一 


readInfo 〈) 先 读 取 一 个 uint64 数 据 ， 然 后 调用 
math 包 的 Float64frombits () 函数 把 它 转换 成 float64 
类 型 。 编 译 器 给 ClassFileTest 类 的 E 字 上 段 生 成 了 一 个 


CONSTANT Double info 常 量 ， 如 图 3-12 所 示 。 


ClassFileTest class X 
> #30 (Utf8): E 











图 3-12 ”用 classpy 观 察 CONSTANT_Double_info 常 量 


3.3.7 CONSTANT _Utf8_info 


CONSTANT_Utf8_info 常 量 里 放 的 是 MUTF-8 
编码 的 字符 串 ， 结 构 如 下 : 


CONSTANT_Utf8_info { 
ul1 tag,; 
u2 length; 
ui bytes[length]; 
} 








注意 ， 字 符 串 在 class 文 件 中 是 以 MUTF- 
8 (Modified UTF-8) 方式 编码 的 。 但 为 什么 没有 用 
标准 的 UTF-8 编 码 方式 ， 笔 者 没有 找到 明确 的 原因 
中 。MUTF-8 编 码 方式 和 UTF-8 大 致 相同 ， 但 并 不 
兼容 。 差 别 有 两 点 : 一 是 null 字 符 《〈 代 码 点 


U+0000) 会 被 编码 成 2 字 节 : 0xC0、0x80; 二 是 补 





充 字 符 (Supplementary Characters， 代 码 点 大 于 


U+FFFF 的 Unicode 字 符 ) 是 按 UTF-16 拆 分 为 代理 对 
(Surrogate Pair) 分 别 编码 的 。 有 其 体 细 贡 超出 了 本 

章 的 讨论 范围 ， 有 兴趣 的 读者 可 以 阅读 Java 虚 拟 机 

规范 和 Unicode 规 范 的 相关 章节 21 。 


在 ch03\classfile 目 录 下 创建 cp_utf8.go 文 件 ， 在 
其 中 定义 ConstantUtf8Info 结 构 体 ， 代 码 如 下 : 


package classfile 

import "fmt" 

import "unicode/utf16" 

type ConstantUtf8Info struct { 
str string 


} 
func (self *ConstantUtf8Info) readIinfo(reader *ClassReader) {} 


readInfo〈() 方法 先 读 取出 [Jbyte， 然 后 调用 
decodeMUTF8() 函数 把 它 解 码 成 Go 字符 串 ， 代 
人 码 如 下 : 


func (self *ConstantUtf8Info) readIinfo(reader *ClassReader) { 
length := uint32(reader.readUint16()) 


bytes := reader.readBytes(length) 
self.str = decodeMUTF8(bytes) 


Java 序 列 化 机 制 也 使 用 了 MUTF-8 编 码 。 
java.io.DataInput 和 java.io.DataOutput 接 口 分 别 定义 
了 readUTF () 和 writeUTE 〈) 方法 ， 可 以 读 写 
MUTF-8 编 码 的 字符 串 。decodeMUTF8() 函数 的 
代码 就 是 笔者 根据 
java.io.DataInputStream.readUTF() 方法 改写 的 。 
代码 很 长 ， 解 释 起 来 也 很 乏味 ， 所 以 这 里 就 不 详细 
解释 了 。 因 为 Go 语言 字符 串 使 用 UTF-8 编 码 ， 所 以 
如 果 字 符 串 中 不 包含 null 字 符 或 补充 字符 ， 下 面 这 
个 简化 版 的 readMUTF8() 也 是 可 以 工作 的 。 














// 简化 版 ， 完 整 版 请 阅读 本 章 源 代码 


func decodeMUTF8(bytes [lbyte) string { 
return string(bytes) 


} 


相信 细心 的 读者 在 前 面 的 截图 中 已 经 看 到 了 ， 
字段 名 、 字 段 描述 符 等 就 是 以 字符 串 的 形式 存储 在 
class 文 件 中 的 ， 如 字段 PI 对 应 的 
CONSTANT _Utf8_info 常 量 ， 如 图 3-13 所 示 。 


CiassFileTest.class 关 





图 3-13 ”用 classpy 观 察 CONSTANT_Utf8_info 常 量 
上 这 个 链接 中 有 一 些 线索 : 
http:/ /stackoverflow.com/ guestions/15440584/why- 
does-Java-use-modified-utf-8-instead-of-utf-8。 

加 或 者 这 篇 文章 : 
http:/ /www.otracle.com/technetwork/articles/javase/sut 


142654.html。 


3.3.8 CONSTANT _String_info 


CONSTANT_String_info 常 量 表示 





java.lang.String 字 和 耐量， 结构 如 下 : 


CONSTANT_String_info { 
ui1 tag; 
U2 string_index; 


} 
可 以 看 到 ，CONSTANT_String_info 本 身 并 不 
存放 字符 串 数据 ， 只 存 了 当量 池 索 引 ， 这 个 索引 指 


向 一 个 CONSTANT Utf8 info 常 量 。 在 ch03\classfile 








目录 下 创建 cp_string.go 文 件 ， 在 其 中 定义 
ConstantStringInfo 结 构 体 ， 代 人 码 如 下 : 


package classfile 
type ConstantStringInfo struct { 


cp ConstantPool 
stringIndex uint16 


func (self *ConstantStringInfo) readIinfo(reader *ClassReader) 


func (self *ConstantStringInfo) String() string {...} 





readInfo〈) 方法 读 取 和 常量 池 索 引 ， 代 码 如 
下 : 





func (self *ConstantStringInfo) readIinfo(reader *ClassReader) 
self.stringIndex = reader.readUint16() 


} 





String() 方法 按 索引 从 名 和 量 池 中 得 找 字符 
串 ， 代 码 如 下 : 





func (self *ConstantStringInfo) String() string { 
return self.cp.getUtf8(self.stringIndex) 
} 








ClassFileTest 的 main 〈) 方法 使 用 了 字符 串 字 
量 “Hello，World! ”， 对 应 的 


CONSTANT _String_info 常 量 如 图 3-14 所 示 。 


|| ClassFileTest.class X 





Y constantPool 000| Ca FE BA BE 00 00 00 34 00 40 OA 00 06 00 31 09 
bp #01 (Methodref): java/lang = 0010| 00 32 00 33 Ba OA 00 35 00 36 07 00 37 07 
» #02 (fieldrep: java/lang/si P0201 00 38 01 00 04 46 4C 41 47 01 00 01 5a 01 00 OD 

030| 43 6F 6E 73 74 61 6E 74 56 61 6C 75 65 03 O00 On 
0O<O | DD D1 01 00 04 42 59 54 45 01 600 01 42 03 00 00 
tag: 8 50| 00 78 O01 00 01 58 01 00 01 43 03 00 00 00 58 01 
stringindex: 52 )€ 00 05 53 48 4F 52 54 01 00 01 53 03 00 00 30 39 

- nn 4 一 "3 A | 4 | »”" ”™ ~ 1 ” 


图 3-14 用 classpy 观 察 CONSTANT_String info 常 量 


可 以 看 到 ，string_index 是 52 (0x34) 。 我 们 按 
图 索 轻 ， 从 和 常量 池 中 找 出 第 52 个 和 常量， 确实 是 个 
CONSTANT Utf8 info， 如 图 3-15 所 示 。 


ClassFileTest.class X 


ETT 15 7 74 2e ex et 7e 6 oc 00 22 00 23 57 00 3 oc 
tag: 1 )190| 00 3B 00 3C BQO0NODNs0NGo0G6NoG GE 200200 Woe 
length: 13 x02 07 00 3D 0c 00 3E 00 3F 01 00 1D 6R 





J1BO| 76 6D 67 6F 2F 62 6€6F 6F 6B 2F 63 68 30 33 2F 43 
bytes: Hello ,Worldi RE A 
I1cO| ec el 13 13 46 &€9 €C 6€3 v4 6o /3 74 01 00 10 6A 


图 3-15 ”用 classpy 观 察 CONSTANT_String info 常 量 
(2) 


3.3.9 ” CONSTANT Class_info 





CONSTANT_Class_info 常 量 表示 类 或 者 接口 的 
符号 引用 ， 结 构 如 下 : 





CONSTANT_Class_info { 
u1 tag,; 
U2 name_index; 


} 





和 CONSTANT_String_info 类 似 ，name_index 
是 常量 池 索 引 ， 指 向 CONSTANT_Utf8_info 常 量 。 
在 ch03\classfile 目 录 下 创建 cp_class.go 文 件 ， 在 其 中 
定义 ConstantClassInfo 结 构 体 ， 代 码 如 下 : 


package classfile 

type ConstantClassInfo Struct { 
cp ConstantPool 
NameIndex uint16 


} 
func (self *ConstantClassInfo) readIinfo(reader *ClassReader) { 
self.nameIndex = reader.readUint16() 


func (self *ConstantClassInfo) Name() string { 


return self.cp.getuUtf8(self.nameIndex) 





代码 和 前 一 节 大 同 小 异 ， 束 不 多 解释 了 。 关 和 
超 类 索引 ， 以 及 接口 表 中 的 接口 索引 指 同 的 都 是 
CONSTANT_Class_info 常 量 。 由 图 3-3 可 知 ， 
ClassFileTest 的 this_class 索 引 是 5。 我 们 找到 第 5 个 
常量 ， 可 以 看 到 ， 的 确 是 CONSTANT_Class_info。 


它 的 name index 是 55 (0x37) ， 如 图 3-16 所 示 。 


再 看 第 55 个 和 常量， 也 的 确 是 
CONSTANT Ut info， 如 图 3-17 所 示 。 


ClassFileTest.class X 
| v #05 (Class): jvmgo/book/ch03/ClassFileTest 40. .02 00. G6 00: 3 O00 | a 
人 一 35 00 36 B00 S37 07 3 S.6 
| tag- / 
| 。 


bl 00 01 SA O01 O00 0D ye ~ ("~ 
nameindex: 55 ] 了 < 


61 6C 75 65 门 3 
Be ow 


图 3-16 ”用 classpy 观 察 CONSTANT_Class_info 常 量 





| ClassFileTest.classX | 








3E 00 3F OI O00 ID a [|Z1d(0 = 5 2 


DE A 0 
tag: 1 B 2F 63 68 30 33 2F 43 |vmgo/book/ch03/C 
Ienath- 29 Gs 01 00 10 6R |lassFileTest...] 
Ws | F 4F 62 6A 65 63 74 01 |ava/lang/Object. 
bytes: jvmgo/book/ch03/ClassFileTest 1 6E 67 2F 52 75 6E 74 |..java/lang/Runt 


图 3-17 用 classpy 观 察 CONSTANT_Class_info 常 量 
(2) 


3.3.10 CONSTANT_NameAndType_info 





CONSTANT_NameAndType_info 给 出 字段 或 方 
法 的 名 称 和 摘 述 符 。CONSTANT _Class_info 和 
CONSTANT_NameAndType_info 加 在 一 起 可 以 唯一 
确定 一 个 字段 或 者 方法 。 其 结构 如 下 : 





CONSTANT_NameAndType_info { 
UL tag; 
U2 name_index; 
U2 descriptor_index; 








字段 或 方法 名 由 name index 给 出 ， 字 上 段 或 方法 


的 描述 符 由 descriptor_index 给 出 。name_index 和 





descriptor_index 都 是 第 量 池 索引 ， 指 加 
CONSTANT _Utf8_info 和 常量 。 字 段 和 方法 名 束 是 代 
人 码 中 出 现 的 (或 者 编译 絮 生 成 的 ) 字段 或 方法 的 名 








字 。Java 虚 拟 机 规范 定义 了 一 种 简单 的 语法 来 描述 
字段 和 方法 ， 可 以 根据 下 面 的 规则 生成 描述 符 。 


(基本 类 型 byte、short、char、int、long、float 
和 double 的 描述 答 是 蛙 个 字母 ， 分 别 对 应 B、S、 
C、I、J、F 和 D。 注 意 ，long 的 描述 符 是 J 而 不 是 
as 


@ 引 用 类 型 的 描述 符 是 L 十 类 的 完全 限定 名 十 
、 


半 


(3) 数 组 类型 的 插 述 符 是 [十 数组 元 素 类 型 描述 


付 


2) 字段 插 述 符 束 是 字段 类 型 的 摘 述 符 。 


符 ) + 返回 值 类 型 持 述 符 ， 其 中 void 返回 值 由 单个 


A 


更 详细 的 介绍 可 以 参考 Java 虚 拟 机 规范 4.3 节 。 
表 3-3 给 出 了 一 些 具 体 的 例子 。 


表 3-3 ”字段 和 方法 描述 符 示 例 























字段 描述 符 字段 类 型 方法 描述 符 方 法 
S short OV void run() 
Ljava.lang.Object: java.lang.Object OLiava.lang. String: String toStringO 
[I int[] (Lijava.lang.String:)V void main(String[] args) 
[[D double[][] (FF)F int max(float x. float y) 
[Djava.lang.String: java.lang.Object[] ([IDI int binarySearch(long[] a. long key) 





我 们 都 知道 ，Java 语 言 支 持 方法 重 载 
(Coverride) ， 不 同 的 方法 可 以 有 相同 的 名 字 ， 只 
要 参数 列表 不 同 即 可 。 这 束 是 为 什么 
CONSTANT_NameAndType_info 结 构 要 同时 包含 名 


称 和 描述 符 的 原因 。 那 么 字段 呢 ?jJava 古 不 能 定义 








多 个 同名 字段 的 ， 哪 怕 它 们 的 类 型 各 不 相同 。 这 只 
是 Java 语 法 的 限制 而 已 ， 从 class 文 件 的 层面 来 看 ， 
是 完全 可 以 支持 这 点 的 。 


在 ch03\classfile 目 录 下 创建 
cp_name_and_type.go 文 件 ， 在 其 中 定义 
ConstantrName-AndTypelInfo 结 构 体 ， 代 码 如 下 : 





package classfile 

type ConstantNameAndTypeInfo struct { 
NameIndex uint16 
descriptorIindex uint16 


func (self *ConstantNameAndTypeInfo) readIinfo(reader *ClassRea 
self.nameIndex = reader.readUint16() 
self.descriptorIindex = reader.readUint16() 


} 





代码 比较 人 简单， 就 不 多 解释 了 。 


3.3.11 CONSTANT _ Fieldref info、 
CONSTANT Methodref info 和 


CONSTANT Interface Methodref info 


CONSTANT_Fieldref_info 表 示 字 上 段 符号 引用 ， 
CONSTANT_Methodref_info 表 示 普 通 ( 非 接口 ) 方 
法 符号 引用 ，CONSTANT InterfaceMethodref info 
表示 接口 方法 符号 引用 。 这 三 种 常量 结构 一 模 一 
样 ， 为 了 节约 篇 幅 ， 下 面 只 给 出 
CONSTANT _Fieldref info 的 结构 。 


CONSTANT_Fieldref_info { 
ui1 tag,; 
U2 class_index; 
U2 name_and_type_index; 


} 


class_index 和 name_and_type_index 都 是 常量 池 





索引 ， 分 别 指 同 CONSTANT_Class_info 和 
CONSTANT_NameAndType_info 常 量 。 先 定义 一 个 
统一 的 结构 体 ConstantMemberrefInfo 来 表示 这 3 种 和 党 
量 。 在 ch03\classfile 目 录 下 创建 cp_member_ref.go 文 
作 >: 反 下面 胸 代 公 徊 太志 大 3 





package classfile 
type ConstantMemberrefInfo struct { 


cp ConstantPool 
classIndex uint16 
nameAndTypeIndex uint16 


func (self *ConstantMemberrefInfo) readIinfo(reader *ClassReade 


self.classIndex = reader.readUint16() 
self.nameAndTypeIndex = reader.readUint16() 


func (self *ConstantMemberrefInfo) ClassName() string { 
return self.cp.getClassName(self.classIindex) 


func (self *ConstantMemberrefInfo) NameAndDescriptor() (string 


return self.cp.getNameAndType(self.nameAndTypeIndex) 
} 





然后 定义 三 个 结构 体 “ 继 


承 ”ConstantMemberrefInfo。Go 语 言 并 没有 “继承 ”这 





个 概念 ， 但 是 可 以 通过 结构 体 艇 套 来 模拟 ， 代 人 码 如 


区 


type ConstantFieldrefInfo struct{ ConstantMemberrefInfo } 
type ConstantMethodrefInfo struct{ ConstantMemberrefInfo } 
type ConstantInterfaceMethodrefInfo struct{ ConstantMemberrefI 


ClassFileTest 类 的 main 〈) 方法 使 用 了 
java.lang.System 类 的 out 字 段 ， 访 字段 由 第 量 池 第 2 
项 指出 ， 如 图 3-18 所 示 。 


可 以 看 到 ，class_index 是 50 (0x32) ， 
name_and_type_index 是 51 (0x33) 。 我 们 找到 第 50 
和 第 51 个 常量， 可 以 看 到 ， 确 实 古 
CONSTANT Class info 和 CONSTANT Name- 


AndType_info， 如 图 3-19 所 示 。 





图 3-18 用 clas spy 观 等 CONSTANT_Fieldref info 党 


号 


一 一 一 


里 


ClassFileTest.class X 





- NA 45 78 63 65 70 74 69 6F |ring; .Exce 
” 

he ‘A 53 6F 75 72 63 65 46 69 |ns..9...Sour 
tag: 7 '1 73 73 46 69 6C 65 54 65 |ie...ClassFi 
namelndex: 58 IC 00 22 00 23 8099 OC |st.java-。”. 习 
8 6 oA CF 20 57 € i 加 

v #51 (NameAndType): out&Ljava/io/PrintStream: ||® 65 6C 6C 6F 2C 20 57 6F |.;-.<...Hell 
ICc 00 3E 00 3F 01 00 1D €A |rld!, =, .>.: 
tag. 12 'F 6B 2F 63 68 30 33 2F 43 |vmgo/book/ct 
namelndex: 59 '5 54 65 73 74 01 00 10 CA |lassFileTest 
descriptorindex: 60 了 2F 4F 62 ecR 65 63 74 91 lava/lang/oOb] 
~" 民生 FP £7 IF 9 75 FF 24 | araiianml 


图 3-19 用 clas spy 观 等 CONSTANT_Fieldref info 常 


量 (2) 


3.3.12 和 铝 量 池 小 结 


还 有 三 个 常量 没有 介绍 : 
CONSTANT_MethodType_info、 
CONSTANT MethodHandle info 利 
CONSTANT_InvokeDynamic_info。 它 们 是 Java SE 
7 才 添加 到 class 文 件 中 的 ， 目 的 是 文 持 新 增 的 
invokedynamic 指 令 。 本 书 不 讨论 invokedynamic 指 
令 ， 所 以 解析 这 三 个 第 量 的 代码 就 不 在 这 里 介绍 
了 。 代 码 也 非常 简单 ， 有 兴趣 的 读者 可 以 阅读 随 书 
源 代码 中 的 ch03\cp_invoke_dynamic.go 文 件 。 








可 以 把 常量 池 中 的 常量 分 为 两 类 : 字面 量 
Gliteral) 和 符号 引用 (symbolic reference) 。 字 面 


量 包括 数字 钟 量 和 字符 种 帝 量 ， 符 号 引用 包括 类 和 

















接口 名 、 字 段 和 方法 信息 等 。 除 了 字面 量 ， 其 他 稼 

量 都 是 通过 索引 直接 或 间接 指 同 

CONSTANT Utf8 info 常 量 ， 以 

CONSTANT _Fieldref info 为 例 ， 如 图 3-20 所 示 。 
Fieldref info ed Class_info Utfs info 


class index 一 name index bytes 


name and type Index 一 





和 NameAndType info 
name index 


descriptor index 一 


图 3-20 ”常量 引用 关系 


本 节 只 是 简单 介绍 常量 池 和 各 种 常量 的 结构 ， 
在 第 6 章 讨 论 运行 时 常量 池 ， 第 7 章 讨 论 方法 调用 
时 ， 会 进一步 讨论 它们 的 用 途 。 


3.4 解析 属性 表 


3.2 节 大 致 勾勒 出 了 class 文 件 的 结构 ，3.3 贡 介 
绍 了 第 量 池 。 细 心 的 读者 一 定 会 太 现 ， 还 有 一 些 重 
要 的 信息 没有 出 现 ， 如 方法 的 字 节 人 码 等。 那么 这 些 
言 轧 存在 哪里 呢 ? 答案 是 属性 表 。 属 性 表 可 谓 是 个 
大 杂烩 ， 里 面 存 储 了 各 式 各 样 的 信息 。 本 节 将 详细 
讨论 属性 表 。 








3.4.1 AttributeInfo 接 口 





和 和 钟 量 池 关 似 ， 各 种 属性 表达 的 信息 也 各 不 相 
同 ， 因 此 无 法 用 统一 的 结构 来 定义 。 不 同 之 处 在 
于 ， 钟 量 是 由 Java 虚 拟 机 规范 严格 定义 的 ， 共 有 14 
种 。 但 属性 是 可 以 扩展 的 ， 不 同 的 虚拟 机 实现 可 以 
定义 目 己 的 属性 关 型 。 由 于 这 个 原因 ，Java 虚 拟 机 
规范 没有 使 用 tag， 而 是 使 用 属性 名 来 区 别 不 同 的 属 
性 。 属 性 数据 放 在 属性 名 之 后 的 ul 表 中 ， 这 样 Java 
虚拟 机 实现 就 可 以 跳 过 自己 无 法 识别 的 属性 。 属 性 
的 结构 定义 如 下 : 

















attribute info { 
U2 attribute name_index; 
u4 attribute_ length; 
uli info[attribute_ length]; 
} 





生意 ， 属 性 表 中 存放 的 属性 名 实际 上 并 不 是 编 
人 码 后 的 字符 串 ， 而 是 常量 池 索 引 ， 指 问 和 常量 池 中 的 
CONSTANT Utf8 info 和 常量 。 在 ch03\classfile 目 录 下 





创建 attribute_info.go 文 件 ， 在 其 中 定义 AttributeInfo 
接口 ， 代 码 如 下 : 





package classfile 

type AttributeInfo interface { 
readIinfo(reader *ClassReader) 

} 


func readAttributes(reader *ClassReader, cp ConstantPool) []At 
func readAttribute(reader *ClassReader, cp ConstantPool) Attri 
func newAttributeInfo(attrName string, attrLen uint32, 

cp ConstantPool) AttributeInfo {...} 





和 ConstantInfo 接 口 一 样 ，AttributeInfo 接 口 也 
只 定义 了 一 个 readInfo() 方法 ， 需 要 由 具体 的 属 
性 实现 。readAttributes () 函数 读 取 属性 表 ， 代 码 
如 下 : 








func readAttributes(reader *ClassReader, cp ConstantPool) []At 
attributesCount := reader.readUint16() 
attributes := make([]AttributeInfo, attributesCount) 


for i := range attributes { 
attributes[I] = readAttribute(reader, cp) 


return attributes 


} 





函数 readAttribute () 读 取 单个 属性 ， 代 码 如 
Ts 





func readAttribute(reader *ClassReader, cp ConstantPool) Attri 


attrNameIndex := reader.readUint16() 

attrName := cp.getUtf8(attrNameIndex) 

attrLen := reader.readUint32() 

attrInfo := newAttributeInfo(attrName, attrLen, cp) 


attrIinfo.readInfo(reader) 
return attrInfo 








readAttribute () 先 读 取 属性 名 索引 ， 根 据 它 
从 常量 池 中 找到 属性 名 ， 然 后 读 取 属性 长 度 ， 接 着 
调用 newAttributeInfo () 函数 创建 具体 的 属性 实 
例 。Java 虚 拟 机 规范 预定 义 了 23 种 属性 ， 先 解析 其 
中 的 8 种 。newAttributeInfo () 函数 的 代码 如 下 : 





func newAttributeInfo(attrName string, attrLen uint32, 


cp ConstantPool) AttributeInfo { 
Switch attrName { 
case "Code": return &CodeAttribute{cp: cp} 
case "ConstantValue": return &ConstantValueAttributef{} 
case "Deprecated": return &DeprecatedAttributef{} 
case "Exceptions": return &ExceptionsAttributef{} 
case "LineNumberTable": return &LineNumberTableAttributef{} 
case "LocalVariableTable": return &LocalVariableTableAttritk 
case "SourceFile": return &SourceFileAttribute{cp: cp} 
case "Synthetic": return &SyntheticAttribute{} 
default: return &UnparsedAttribute{attrName, attrLen, nil} 


l 





UnparsedAttribute 结 构 体 在 
ch03\classfile\attr_unparsed.go 文 件 中 ， 代 码 如 下 : 





package classfile 
type UnparsedAttribute struct { 
name string 
length uint32 
info [jbyte 
} 
func (self *UnparsedAttribute) readIinfo(reader *ClassReader) { 
self.info = reader.readBytes(self.1length) 


} 





按照 用 途 ，23 种 预定 义 属性 可 以 分 为 三 组 
一 组 属性 是 实现 Java 虚 拟 机 所 必需 的 ， 共 有 5 种 ; 
二 组 属性 是 Java 类 库 所 必需 的 ， 共 有 12 种 ;第 三 组 


属性 主要 提供 给 工具 使 用 ， 共 有 6 种 。 第 三 组 属性 
是 可 选 的 ， 也 就 是 说 可 以 不 出 现在 class 文 件 中 。 如 
果 class 文 件 中 存在 第 三 组 属性 ，Java 虚 拟 机 实现 或 
者 Java 类 库 也 是 可 以 利用 它们 的 ， 比 如 使 用 


LineNumberTable 属 性 在 异常 堆栈 中 显示 行 号 。 














从 class 文 件 演进 的 角度 来 计 ，JDK1.0 时 只 有 6 
种 预定 义 属 性 ，JDK1.1 增 加 了 3 种 。J2SE 5.0 增 加 了 
9 种 属性 ， 主 要 用 于 文 持 泛 型 和 注解 。Java SE 6 增 
加 了 StackMapTable 属 性 ， 用 于 优化 字 市 码 验 证 。 
Java SE 7 增加 了 BootstrapMethods 属 性 ， 用 于 支持 
新 增 的 invokedynamic 指 令 。Java SE 8 又 增加 了 三 种 
属性 。 表 3-5 给 出 了 这 23 种 属性 出 现 的 Java 版 本 、 分 
组 以 及 它们 在 class 文 件 中 的 位 置 。 





表 3-4 预定 义 属性 
































属性 名 Java SE 分 组 位 置 
ConstantValue 1.0.2 1 field info 
Code 1.0.2 1 method_ info 
Exceptions E02 1 method info 
SourceFile 1.0.2 3 ClassFile 
LineNumberTable 1.0.2 3 Code 
LocalVariableTable 1.0.2 3 Code 
InnerClasses 1.1 2 ClassFile 
Synthetic | 2 ClassFile. field_info. method info 
Deprecated El 3 ClassFile. field_info. method_ info 
EnclosineMethod 0 2 ClassFile 
Signature 0 2 ClassFile. field_info. method info 
SourceDebugExtension 5.0 3 ClassFile 
LocalVariableTypeTable 5.0 3 Code 
RuntimeVisibleAnnotations 5.0 2 ClassFile. field_info. method info 
RuntimelInvisibleAnnotations 5.0 2 ClassFile. field_info. method info 

( 续 ) 

属性 名 Java SE 分 组 位 置 
RuntimeVisibleParameterAnnotations 5.0 2 method info 
RuntimeInvisibleParameterAnnotations 5.0 2 method info 
AnnotationDefault 5.0 2 method info 
StackMapTable 6 1 Code 
BootstrapMethods 7 1 ClassFile 
RuntimeVisibleTypeAnnotations 8 2 ClassFile. field_info. method info. Code 
RuntimeInvisibleTypeAnnotations 8 2 ClassFile. field_info. method info. Code 
MethodParameters 8 2 method info 


由 于 篇 幅 的 限制 ， 下 面 只 介绍 其 中 的 8 种 属 
性 。 


3.4.2 ”Deprecated 和 Synthetic 属性 


Deprecated 和 Synthetic 是 最 简单 的 两 种 属性 ， 
仅 起 标记 作用 ， 不 包含 任何 数据 。 这 两 种 属性 都 是 
JDK1.1 引 入 的 ， 可 以 出 现在 ClassFile、field_info 和 
method_info 结 构 中 ， 它 们 的 结构 定义 如 下 : 


Deprecated_attribute { 
U2 attribute name_index; 
u4 attribute_ length; 

} 

Synthetic attribute { 
U2 attribute name_index; 
u4 attribute_length; 

} 


由 于 不 包含 任何 数据 ， 所 以 attribute_length 的 
值 必须 是 0。Deprecated 属 性 用 于 指出 类 、 接 口 、 字 
段 或 方法 已 经 不 建议 使 用 ， 编 译 器 等 工具 可 以 根据 
Deprecated 属 性 输出 警告 信息 。J2SE 5.0 之 前 可 以 使 





用 Javadoc 提 供 的 @deprecated 标 签 指示 编译 如 给 
类 、 接 口 、 字 段 或 方法 添加 Deprecated 属 性 ， 语 法 
格式 如 下 : 








/** Q@deprecated */ 
public void oldMethod() {...} 


从 J2SE 5.0 开 始 ， 也 可 以 使 用 @Deprecated 注 
解 ， 语 法 格式 如 下 : 


@Deprecated 
public void oldMethod() {} 





Synthetic 属性 用 来 标记 源 文件 中 不 存在 、 由 编 
译 器 生成 的 类 成 员 ， 引 入 Synthetic 属性 主要 是 为 了 
支持 肉 套 类 和 舱 套 接口 。 具 体 细节 就 不 介绍 了 ， 感 
兴趣 的 读者 可 以 参考 Java 虚 拟 机 规范 相关 章节 。 在 
ch03\classfile 目 录 下 创建 attr_markers.go 文 件 ， 在 其 











中 定义 DeprecatedAttribute 和 SyntheticAttribute 结 构 
体 ， 代 码 如 下 : 





package classfile 

type DeprecatedAttribute struct { MarkerAttribute } 

type SyntheticAttribute struct { MarkerAttribute } 

type MarkerAttribute struct{} 

func (self *MarkerAttribute) readIinfo(reader *ClassReader) { 
// read nothing 

. 





由 于 这 两 个 属性 都 没有 数据 ， 所 以 
readInfo () 方法 是 空 的 。 


3.4.3 ”SourceFile 属 性 


SourceFile 是 可 选 定 长 属性 ， 只 会 出 现在 
ClassFile 结 构 中 ， 用 于 指出 源 文 件 名 。 其 结构 定义 
如 下 : 


SourceFile attribute { 
U2 attribute name_index; 
u4 attribute_length; 
U2 sourcefile index; 


} 


attribute_length 的 值 必须 是 2。sourcefile_index 
是 常量 池 索 引 ， 指 向 CONSTANT _Utf8_info 常 量 。 
在 ch03\classfile 目 录 下 创建 attr_source_file.go 文 件 ， 
在 其 中 定义 SourceFileAttribute 结 构 体 ， 代 码 如 下 : 


package classfile 

type SourceFileAttribute struct { 
cp ConstantPool 
sourceFileIndex uint16 


func (self *SourceFileAttribute) readInfol(reader *ClassReader) 
self.sourceFileIndex = reader.readUint16() 


func (self *SourceFileAttribute) FileName() string { 
return self.cp.getUtf8(self.sourceFileIindex) 
} 





笔者 的 编译 器 给 ClassEFileTest 生 成 了 SourceFile 
属性 ， 如 图 3-21 所 示 。 


v atributes 1 00 00 9982 00 02 12 OF 36 00 04 BH 00 Vo: 00 

601 :16 00 26 06 00 90E 放 衣 本 的 全 故 的 部 的 
attributeNamelndex- 47 0370| 2C 00 00 00 2D 00 00 00 04 00 01 00 2E 00 | 
attributeLength-; 2 0380| 2F 00 00 00 02 00 30 


sourcefFileindex: #48->ClassFileTest. java 


图 3-21 ”用 classpy 观 察 SoufceFile 属 性 


第 47 和 第 48 个 常量 ， 确 实 都 是 


CONSTANT _Utf8_info 常 量 ， 如 图 3-22 所 示 。 


» #47 {Utf8): SourceFile J160| 6E 73 07 00 39 0 00 Da 53 EF 75 72 63 65 #6 69 | 
b #48 (Urf8); ClassFileTest.java 23170| 6C 65 01 00 i2 43 6C 61 73 73 46 69 6C 65 54 65 


mM- r= a Mr ea ~ an Man an nan Am nn- 


图 3-22 ”用 classpy 观 察 SouftceFile 属 性 (2) 


3.4.4 ConstantValue 属 性 





ConstantValue 是 定 长 属性 ， 只 会 出 现在 
field_info 结 构 中 ， 用 于 表示 各 量 表 达 式 的 值 〈 详 见 


Java 语 言 规范 的 15.28 节 ) 。 其 结构 定义 如 下 : 


ConstantValue attribute { 
U2 attribute name_index; 
u4 attribute_length; 

U2 constantvalue_ index; 


} 


attribute_length 的 值 必须 是 2。 
constantvalue_index 是 常量 池 索 引 ， 但 具体 指 疝 哪 种 
常量 因 字 上 段 类 型 而 异 。 表 3-6 给 出 了 字段 类 型 和 常 


量 类 型 的 对 应 关系 。 

















字段 类 型 常量 类 型 
long CONSTANT Long info 
fioat CONSTANT Float info 
double CONSTANT Double info 
int. short. char. byte. boolean CONSTANT Integer_info 
String CONSTANT String_info 


在 ch03\classfile 目 录 下 创建 
attr_constant_value.go 文 件 ， 在 其 中 定义 


ConstantValueAttribute 结 构 体 ， 代 码 如 下 : 





package classfile 

type ConstantValueAttribute struct { 
constantValueIndex uint16 

} 

func (self *ConstantValueAttribute) readIinfo(reader *ClassRead 
self.constantValueIndex = reader.readUint16() 


func (self *ConstantValueAttribute) ConstantValueIndex() uint1 
return self.constantValueIndex 


} 





在 第 6 章 讨论 类 和 对 象 时 ， 会 介绍 如 何 使 用 
ConstantValue 属 性 。 下 面 用 classpy 观 察 
ClassFileTest 类 的 FLAG 字 7 段 ， 如 图 3-23 所 示 。 


ClassFileTest.class X 





v fields 01E0| 00 1A 6A 61 76 61 2F 6C 61 6E 67 2F 52 75 6E 74 | 
v #0: FLAG 01F0| 69 6D 65 45 78 63 65 70 74 69 6F 6E 01 00 10 6 | 
9200| 61 76 61 2F 6C 61 6E 67 2F 53 79 73 74 65 6D 01 | 
acce55 ag5 ACC_FUBLIC, ACCST Do210| 00: 03 6F 75 74 01 00 15 4c €A 61 76 61 2F 69 6F | 
namelndex: #7->FLAG 0220| 2F 50 72 69 6E 74 53 74 72 65 61 6D 3B 01 00 13 | 
descriptorindex: #8->Z 0230| 6R 61 76 61 2F 69 6F 2F 50 72 69 6E 74 53 74 72 | 
dine 0240| 65 61 6D 01 00 07 70 72 69 6E 74 6C 6E 01 00 15 | 
SO 9250| 28 4C 6A 61 76 61 2F 6C 61 6E 67 2F 53 74 72 69 
v attributes 0260| 6E 67 3B 29 56 00 21 00 05 00 0 00 00 08 00 
v #0 (ConstantValue) 0270| 19 00 07 00 08 00 01 ED9000050000102650008 00 
9280| 19 00 0B 00 oc 0 00 09 0 00 02 00 0D 00 
| Inde) > SE 2 "i 有 3 
ERLE NMG NO 9290| 19 00 OF 00 OF 09 00 00 00 02 00 10 00 
attributeLength- 2 02A0| 19 00 13 2 09 0 00 02 00 13 00 
ConstantValuelndex: #10->1 2B80| 19 ) 14 5 09 1 0 00 02 ) 16 00 


图 3-23 ”用 classpy 观 察 ConstantValue 属 性 


可 以 看 到 ， 属 性 表 里 确实 有 一 个 ConstantValue 
属性 ，constantvalue_index 是 10 (0x0A) ， 指 问 


CONSTANT_Integer_info， 如 图 3-24 所 示 。 


ClassFileTest.class X 





v #10 (Integer): 1 io301 43 €F 6E 73 74 61 €E 74 56 61 6C 75 65 ED 人 
tag: 3 Da 01 00 04 42 59 54 45 01 00 01 42 03 00 00 | 
ones | 


图 3-24 ”用 classpy 观 察 ConstantValue 属 性 (2) 


3.4.5 ”Code 属 性 


Code 是 变 长 属性 ， 只 存在 于 method_info 结 构 
中 。Code 属 性 中 存放 字 节 人 码 等 方法 相关 信息 。 相 比 
前 面 介绍 的 几 种 属性 ，Code 属 性 比较 复杂 ， 其 结构 
定义 如 下 : 











Code_attribute { 
U2 attribute name_index; 
u4 attribute_length; 
U2 max_stack; 
U2 max_locals; 
u4 code_length; 
uU1L code[code_ length]; 
U2 exception_ table_ length; 
{ U2 start_pc; 
U2 end_pc; 
u2 handler_pc; 
U2 catch_type; 
} exception table[exception_table length]; 
U2 attributes_ count,; 
attribute info attributes[attributes count]; 





max_stack 给 出 操作 数 栈 的 最 大 深度 ， 





max_locals 给 出 局 部 变量 表 大 小 。 接 着 是 字 贡 人 码 ， 
存在 u1 表 中 。 最 后 是 开 单 处理 表 和 属性 表 。 在 第 4 
草 讨 论 运行 时 数据 区 ， 并 且 实 现 操 作 数 栈 和 局 部 变 
量 表 时 ，max_stack 和 max_locals 就 会 派 上 用 场 。 在 
第 5 章 讨论 指令 集 和 解释 器 时 ， 会 用 到 字 节 人 码 。 在 
第 10 章 讨论 异常 处 理 时 ， 会 使 用 异常 处 理 表 。 











把 Code 属 性 结构 翻译 成 Go 结构 体 ， 定 义 在 
ch03\classfile\attr_code.go 文 件 中 ， 代 码 如 下 : 





package classfile 
type CodeAttribute struct { 


cp ConstantPool 

maxStack uint16 

maxLocals uint16 

code [jbyte 
exceptionTable []*ExceptionTableEntry 
attributes []AttributeInfo 


type ExceptionTableEntry struct { 


StartPc uint16 
endPc uint16 
handlerPpc uint16 
catchType uint16 


} 
func (self *CodeAttribute) readIinfo(reader *ClassReader) {...} 


| | 


readInfo 〈) 方法 的 代码 如 下 : 





func (self *CodeAttribute) readIinfo(reader *ClassReader) { 
self.maxStack = reader.readUint16() 
self.maxLocals = reader.readUint16() 
codeLength := reader.readUint32() 
self.code = reader.readBytes(codeLength) 
self.exceptionTable = readExceptionTable(reader) 
self.attributes = readAttributes(reader, self.cp) 





readExceptionTable (也 数 的 代码 如 下 : 





func readExceptionTable(reader *ClassReader) [|]*ExceptionTable 
exceptionTableLength := reader.readUint16() 
exceptionTable := make([]*ExceptionTableEntry, exceptionTab 
for i := range exceptionTable { 
exceptionTable[i] = &ExceptionTableEntryt{ 
StartPc : reader ,readUint16()， 
endPc : reader ,readUint16()， 
handlerPc: reader .readUint16()， 
catchType: reader.readUint16(), 


上 
} 


return exceptionTable 





ClassFileTest.main( ) 方法 的 Code 属 性 如 图 3- 


25 所 示 。 


10210| 00 03 6PF 75 74 01 00 15 4C 6R €1 76 61 2F 69 6P 


了 Tt#l main 
|o2201 2F 50 72 69 6E 74 53 74 72 65 61 6D 3B 01 00 13 
accessFlags: ACC-PUBLIC, ACC_STATIC |02301 €A 61 76 €1 2F €9 6F 2F 50 72 69 6E 74 53 74 72 
namelndex: #41->main |02401 €5 61 6D 01 00 07 70 72 69 €E 74 6c 6E 01 00 15 


| 
| 
| 
| | 
descriptorindex: #42-_>(lLjava/iang/String)V | 1o2501 28 4c 6R 61 76 61 2F 6C 61 6E 67 2F 53 74 72 69 | 
|o260| éE 67 3B 29 56 00 21 00 05 00 06 00 00 00 08 00 | 
attributesCount: 2 |o270| 19 oo 07 00 08 00 01 00 09 00 00 00 02 00 Oa 00 | 
v attributes |oz801 19 00 oB 00 oc 00 01 00 09 00 00 00 02 00 op 00 | 
lo290| 19 00 OF 00 oF 00 01 00 09 00 00 00 02 00 10 00 | 
| 

| 

| 

| 

| 

| 

| 

| 

| 





02aA0|1 19 00 11 00 12 00 01 00 09 00 00 00 02 00 13 00 
02B01 19 00 14 00 15 00 01 00 09 00 00 00 02 00 16 00 


attribuUteNamelndex- 36 





attributeLength: 55 02c0| 19 00 17 00 18 00 01 00 09 00 00 00 02 00 19 00 
maxStack: 2 [ea 
maxLocals: 1 | 
codeLength: 9 0300| 

» code 103101 
exceptionTableLength- 0 3 
exceptionTable 
attributesCount: 2 

> attributes 

» #1 (Exceptions) 03801 2 n2 Nn 30 





图 3-25 ”用 classpy 观 察 Code 属 性 


3.4.6 “Exceptions 必 性 


Exceptions 是 变 长 属性 ， 记 录 方 法 抛 出 的 寞 第 
表 ， 其 结构 定义 如 下 : 





Exceptions_attribute { 
U2 attribute name_index; 
u4 attribute_length; 
U2 number_of_exceptions; 
U2 exception_ index_table[number_of _ exceptions]; 





在 ch03\classfile 目 录 下 创建 attr_exceptions.go 文 
件 ， 在 其 中 定义 ExceptionsAttribute 结 构 体 ， 代 码 如 
下 : 





package classfile 

type ExceptionsAttribute struct { 
exceptionIndexTable [1]uint16 

} 

func (self *ExceptionsAttribute) readIinfo(reader *ClassReader) 
self .exceptionIindexTable = reader.readUint16s() 

} 

func (self *ExceptionsAttribute) ExceptionIndexTable() [1]uint1 
return self.exceptionIindexTable 


} 





代码 比 较 人 简单 ， 束 不 多 解释 了 。 
ClassFileTest.main 〈) 方法 的 Exceptions 属 性 如 图 3- 


26 所 示 。 





































v #1: main 19 00 0B 00 DC 00 01 00 09 00 00 00 02 00 0D 00 
accessFlags: ACC_PUBLIC, ACC_STATIC 19 DE 00 OF 00 01 00 09 00 00 00 02 00 10 00 
19 1 00 12 00 01 00 09 00 00 00 02 00 13 00 
nameindex: #41->main 局 二 
19 0 35 0 O01 00 09 00 00 02 00 16 00 
descfiptorindex: #42->(Ljava/lang/String;)V 19 00 18 00 01 00 09 00 00 02 00 19 00 
attributeSsCount: 2 02D0| 19 1B 00 iC 00 01 00 09 00 00 02 00 1D 00 
02E0| 19 o0 18 00 1F 00 01 00 09 00 00 00 02 00 20 o0 
02F0| 02 00 01 00 22 00 23 00 01 00 24 00 00 00 2F 00 
> #0 (Code) 0300| 01 00 01 00 00 00 05 2A B7 00 01 B1 00 00 00 02 
v #1 (ExCceptions) 0310| 00 25 00 00 00 06 00 01 00 00 00 03 00 26 00 00 
attributeNamelndex: 45 0320| 00 0C 00 01 00 00 00 05 00 27 00 28 00 00 00 09 
03301 00 29 00 2A 00 02 00 24 00 00 00 37 00 02 00 01 
attributeLength: 4 0340| 00 00 00 09 B2 00 02 12 03 B6 00 04 B1 00 00 00 
numberOfExceptions: 1 0350| 02 00 25 00 00 00 OA 00 02 00 00 00 0F 00 08 00 
v exceptionindexTable 0360| 10 26 00 00 00 OC 00 01 00 09 00 2B 00 
: 0370| 2C 00 O02D 000000M00040o00NMoroon2a 00 01 00 

#0; #46->java/lang/RuntimeException 0380| 2F 00 00 00 02 00 30 





图 3-26 ”用 classpy 观 罕 Code 属 性 


3.4.7 LineNumberTable 和 和 
LocalVariableTable 属 性 





LineNumberTable 属 性 表 存 放 方 法 的 行 号 信 
居 ，LocalVariableTable 属 性 表 中 存放 方法 的 局 部 变 
量 信息 。 这 两 种 属性 和 前 面 介绍 的 SourceFile 属 性 
都 属于 调试 信息 ， 都 不 是 运行 时 必需 的 。 在 使 用 
javac 编 译 吉 编译 Java 程 序 时 ， 默 认 会 在 class 文 件 中 
生成 这 些 信 息 。 可 以 使 用 javac 提 供 的 -g: none 选 项 
来 关闭 这 些 信息 的 生成 ， 这 里 就 不 多 介绍 了 ， 具 体 
请 参考 javac 用 法 。 








LineNumberTable 和 LocalVariableTable 属 性 表 
在 结构 上 很 像 ， 下 面 以 LineNumberTable 为 例 进行 
讨论 ， 它 的 结构 定义 如 下 : 





一 


LineNumberTable attribute { 
U2 attribute name_index; 
u4 attribute_length; 
U2 line_number_table_ length; 
{ U2 start_pc; 
U2 line_number; 
} line number_table[line number_table length]; 





把 上 面 的 结构 定义 翻译 成 Go 结构 体 ， 定 义 在 
ch03\classfile\attr_line_number_table.go 文 件 中 ， 代 
人 码 如 下 : 





package classfile 
type LineNumberTableAttribute struct { 
lineNumberTable [1]*LineNumberTableEntry 
} 
type LineNumberTableEntry struct { 
StartPcC uint16 
lineNumber uint16 
} 


func (self *LineNumberTableAttribute) readIinfo(reader *ClassRe 





readInfo 〈( ) 方法 读 取 属性 表 数 据 ， 代 人 码 如 
下 : 





func (self *LineNumberTableAttribute) readIinfo(reader *ClassRe 
lineNumberTableLength := reader.readUint16() 


self.lineNumberTable = make([]*LineNumberTableEntry, lineNu 
for i := range self.lineNumberTable { 
self.lineNumberTable[i] = &LineNumberTableEntryt{ 
startPc: reader .readUint16(), 
lineNumber: reader.readUint16(), 





在 第 10 章 讨论 弄 常 处 理 时 会 详细 讨论 


LineNumberTable 属 性 。 


3.5 测试 本 章 代码 


在 第 2 章 的 测试 中 ， 把 class 文 件 加 载 到 了 内 存 
中 ， 并 且 把 一 扒 看 似 杂 乱 无 章 的 数字 打印 到 了 控制 
台 。 相 信 读 者 一 定 不 会 满足 于 此 。 本 节 惑 来 修改 测 
试 代码 ， 把 命令 行 工 具 临 时 打造 成 一 个 简化 版 的 


javap 。 


打开 ch03\main.go 文 件 ， 修 改 import 语 句 和 
startJVM 〈) 图 数 ， 代 码 如 下 : 


package main 

import "fmt" 

import "strings" 

import "jvmgo/ch03/classfile" 

import "jvmgo/ch03/classpath" 

func main() {...} 

func startJVM(options *cmdline.Options, class string, args [1]s 





main〈() 函数 不 用 变 ， 修 改 startJVM () 函 


数 ， 代 码 如 下 : 





func startJVM(cmd *Cmd) { 


cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
className := strings.Replace(cmd.class, ".", "/", -1) 
cf := loadClass(className, cp) 

fmt.Println(cmd.class) 

printclassInfo(cf) 








loadClass《〈) 函数 读 取 并 解析 class 文 件 ， 代 码 
如 下 : 





func loadClass(className string, cp *classpath.Classpath) *cla 
classData, _, err := cp.ReadcClass(className) 
if err != nil { 
panic(err) 
cf, err := classfile.Parse(classData) 
if err != nil { 
panic(err) 


return cf 





PrintClassInfo〈) 也 数 把 class 文 件 的 一 些 重 要 
言 轧 打印 出 来 ， 代 人 码 如 下 : 








func printClassInfo(cf *classfile.ClassFile) { 
fmt.Printf("version: %v.%v\n", cf.MajorVersion(), cf.Minoryv 
fmt.Printf("constants count: %v\n", len(cf.ConstantPool())) 
fmt.Printf("access flags: Ox%x\n", cf.AccessFlags()) 
fmt.Printf("this class: %v\n", cf.ClassName()) 
fmt.Printf("super class: %v\n", cf.SuperClassName()) 
fmt.Printf("interfaces: %v\n", cf.InterfaceNames()) 
fmt.Printf("fields count: %v\n", len(cf.Fields())) 
for _, f := range cf.Fields() { 

fmt.Printf(" %s\n", f.Name()) 


fmt.Printf("methods count: %v\n", len(cf.Methods())) 
for _, m := range cf.Methods() { 
fmt.Printf(" %s\n", m.Name()) 





打开 命令 行 窗口 ， 执 行 下 面 的 命令 编译 本 章 代 
位。 





go install jvmgo\ch03 





编译 成 功 后 ， 在 D: \govworkspace\bin 目 录 下 会 
出 现 ch03.exe 文 件 。 执 行 ch03.exe， 指 定 -Xjre 选 项 和 
类 名 ， 就 可 以 打印 出 class 文 件 的 信息 。 笔 者 把 
java.lang.String.class 文 件 〈 位 于 rtjar 中 ) 的 信息 打 
印 了 出 来 ， 如 图 3-27 所 示 。 如 果 读 者 想 测 试 自 己 编 





写 的 类 ， 记 得 要 指定 -classpath 选 项 。 与 第 2 章 相 
比 ， 我 们 显然 取得 了 很 大 的 进步 。 





D:\go\workspace\bin>ch03 -Xire ‘C:\Program Files\Java\irel. 8.0 66 java. lang. StTr 四 
ing 
java. lang. String 
version: 52.0 
constants count: 537 

s: OQx31 

java/langyString 

iava/lang/Obiject 


: [java/ io/Serializable java/lang/Conmparable java/lang/CharSequence] 
"~ 


与， 


serialyersionUID 

serialPersistentFields 

CASE INSENSITIVE ORDER 
methods count: 94 

<init> 

<init> 





图 3-27 ch03.exe 的 测试 结果 


3.6 ”本 章 小 结 


计算 机 科学 家 David Wheelet 有 一 名 名言 ; “ 计 
算 机 科学 中 的 任何 难题 都 可 以 通过 增加 一 个 中 间 层 
来 解决 ”1 。ClassFile 结 构 体 就 是 为 了 实现 类 加 载 
功能 而 增加 的 中 间 层 。 在 第 6 章 ， 我 们 会 进一步 处 
理 ClassFile 结 构 体 ， 把 它 转变 Class 结 构 体 ， 并 放 入 
方法 区 。 不 过 在 此 之 前 ， 要 先 在 第 4 章 实现 运行 时 


人 


数据 区 ， 在 第 5 草 实现 字 市 码 解 释 器 。 


[1] 原文 为 All problems in computer science can be 


solved by anothet level of inditection 。 


第 4 章 ”运行 时 数据 区 


第 1 章 编 写 了 命令 行 工具 ， 第 2 章 和 第 3 章 讨论 
了 如 何 搜索 和 解析 class 文 件 。 读 者 也 许 有 些 着 急 
了 ， 为 什么 读 到 第 4 章 后 连 Java 虚 拟 机 的 影子 都 还 
有 看 到 ? 别 着 急 ， 本 章 就 来 讨论 并 初步 实现 运行 时 
数据 区 (tun-time data atea) ， 为 下 一 章 编 写字 节 码 


在 开始 阅读 本 章 之 前 ， 还 是 先 准备 好 目录 结 
构 。 复 制 ch03 目 录 ， 改 名 为 ch04。 修 改 main.go 等 源 
文件 ， 把 impott 语 多 中 的 ch03 全 都 改 成 ch04， 然 后 
在 ch04 目 录 下 创建 ttda1| 子 目录 。 现 在 我 们 的 目录 
结构 应 该 如 下 所 示 : 


D:\go\workspace\src 
|-jvmgo 


| -cho01 ~ cho03 

| -ch04 
|-classfile 
|-classpath 
|-rtda 
|-cmd.go 
|-main.go 





ss 


[1| ttda 是 fuh-time data atea 的 首 字 母 缩写 。 


4.1 运行 时 数据 区 概述 


在 运行 Java 程 序 时 ，Java 虚 拟 机 需要 使 用 内 存 
来 存放 各 式 各 样 的 数据 。Java 虚 拟 机 规范 把 这 些 内 
存 区 域 叫 作 运 行 时 数据 区 。 运 行 时 数据 区 可 以 分 为 
两 类 : 一 类 是 多 线程 共享 的 ， 另 一 类 则 是 线程 私有 
的 。 多 线程 共享 的 运行 时 数据 区 需要 在 Java 虚 拟 机 
局 动 时 创建 好 ， 在 Java 虚 拟 机 退出 时 销毁 。 线 程 私 
有 的 运行 时 数据 区 则 在 创建 线程 时 才 创 建 ， 线 程 退 
出 时 销毁 。 





多 线程 共 圣 的 内 存 区 域 主要 存放 两 类 数据 : 类 
数据 和 类 实例 也 束 是 对 象 )。 对 和 象 数 据 存放 在 堆 
(Heap) 中 ， 类 数据 存放 在 方法 区 (Method 
Area) 中 。 堆 由 垃圾 收集 右 定 期 清理 ， 所 以 程序 员 





不 需要 关心 对 象 空 间 的 释放 。 类 数据 包括 字段 和 方 
法 信息 、 方 法 的 字 节 码 、 运 行 时 常量 池 ， 等 等 。 从 
逻辑 上 来 讲 ， 方 法 区 其 实 也 是 堆 的 一 部 分 。 


线程 私有 的 运行 时 数据 区 用 于 辅助 执行 Java 字 
节 人 码 。 每 个 线程 都 有 自己 的 pc 寄存 器 (Program 
Counter) 和 Java 虚 拟 机 栈 (JVM Stack) 。Java 虚 拟 
机 栈 又 由 栈 帧 〈Stack Frame， 后 面 简称 帧 ) 构成， 
帧 中 保存 方法 执行 的 状态 ， 包 括 局 部 变量 表 (Local 
Variable) 和 操作 数 栈 (Operand Stack) 等 。 在 任 
一 时 刻 ， 某 一 线程 肯定 是 在 执行 某 个 方法 。 这 个 方 
法 叫 作 该 线程 的 当前 方法 ;执行 该 方法 的 帧 叫 作 线 
程 的 当前 帧 ， 声 明 该 方法 的 类 叫 作 当前 类 。 如 果 当 
表 方 法 是 Java 方 法 ， 则 pc 寄存 右 中 存放 当前 正在 执 
行 的 Java 虚 拟 机 指令 的 地 址 ， 和 否则 ， 当 前 方法 是 本 








地 方法 ，pc 和 寄存 左 中 的 值 没有 明确 定义 。 


根据 以 上 描述 ， 可 以 大 致 勺 勒 出 运行 时 数据 区 
的 逻辑 结构 ， 如 图 4-1 所 示 。 


Run-Time Data Area 


Thread Heap 
pe Method Arca 
JVM Stack Class 
Run-Time 
Frame 


Constant Pool 


Local Variable 


Operand Stack Obiect 


图 4-1 运行 时 数据 区 示意 图 


Java 虚 拟 机 规范 对 于 运行 时 数据 区 的 规定 是 相 
当 宽 松 的 。 以 堆 为 例 : 堆 可 以 是 连续 空间 ， 也 可 以 





不 连续 。 扒 的 大 小 可 以 固定 ， 也 可 以 在 运行 时 按 需 
扩展 二 。 虚 拟 机 实现 者 可 以 使 用 任何 垃圾 回收 算 
法 管理 堆 ， 甚 至 完全 不 进行 垃圾 收集 也 是 可 以 的 。 
由 于 Go 本 吴 也 有 垃圾 回收 功能 ， 所 以 可 以 直接 使 用 
Go 的 堆 和 垃圾 收集 磺 ， 这 大 大 简化 了 我 们 的 工作 。 





本 章 将 初步 实现 线程 私有 的 运行 时 数据 区 ， 为 
第 5 章 介 绍 指令 集 打下 基础 。 方 法 区 和 运行 时 常量 


池 将 在 第 6 章 详 细 介 绍 。 


[四 java 命令 提供 了 -Xms 和 -Xmx 两 个 非 标 准 选项 ， 用 
来 调整 堆 的 初始 大 小 和 最 大 大 小 。java 命 令 的 详细 


介绍 请 参考 第 1 章 内 容 。 


4.2 ”数据 类 型 





Java 虚 拟 机 可 以 操作 两 类 数据 : 基本 类 型 
(primitive type 〉 和 引用 类 型 (reference type) 。 
基本 类 型 的 变量 存放 的 了 驶 是 数据 本 身 ， 引 用 类 型 的 
变量 存放 的 是 对 象 引 用 ， 真 正 的 对 象 数 据 是 在 堆 里 
分 配 的 。 这 里 所 说 的 变量 包括 类 变量 (前 态 字 
段 )、 实 例 变 量 〈 非 表态 字段 ，”、 数 组 元 素 、 方 法 
的 参数 和 局 部 变量 ， 等 等 。 





基本 类 型 可 以 进一步 分 为 布尔 类 型 (boolean 
type) 和 数字 类 型 (numeric type) 上 ， 数 字 类 型 
又 可 以 分 为 整数 类 型 (integral type) 和 浮 点 数 类 型 
(floating-point type) 。 引 用 类 型 可 以 进一步 分 为 3 


种 : 类 类 型 、 接 口 类 型 和 数组 类 型 。 类 类 型 引用 指 


向 类 实例 ， 数 组 类 型 引用 指向 数组 实例 ， 接 口 类 型 
引用 指向 实现 了 该 接口 的 类 或 数组 实例 。 引 用 类 型 
有 一 个 特殊 的 值 一 null， 表 示 该 引用 不 指向 任何 
对 象 。 








Go 语言 提供 了 非常 丰富 的 数据 类 型 ， 包 括 各 种 
整数 和 两 种 精度 的 浮 点 数 。Java 和 Go 的 浮 点 数 都 采 
用 IEEE 754 规 范 “| 。 对 于 基本 类 型 ， 可 以 直接 在 
Go 和 Java 之 间 建 立 映 射 关系 。 对 于 引用 类 型 ， 自 然 
的 选择 是 使 用 指针 。Go 提 供 了 nil， 表 示 空 指针 ， 正 
好 可 以 用 来 表示 nul。 由 于 要 到 第 6 章 才 开始 实现 类 
和 对 象 ， 所 以 本 间 先 定义 一 个 临时 的 结构 体 ， 用 它 
来 表示 对 象 。 在 ch04\rtda 目 录 下 创建 object.go， 在 
其 中 定义 Object 结 构 体 ， 代 码 如 下 : 





package rtda 
type Object struct { 
// todo 





表 4-1 对 Java 虚 拟 机 文 持 的 类 型 进行 了 


表 4-1 Java 虚 拟 机 数据 类 型 


M 和 


/AN Ho 
































aa Go 数据 类 型 
byte int8 
short int16 

整数 类 型 i i 
基本 类 型 数字 类 型 long int64 
char uint16 
浮 点 数 类 型 eo 
double float64 
布尔 类 型 boolean bool 
类 类 型 *Object 
引用 类 型 接口 类 型 *#Object 
| 数组 类 型 *Object 
null nil 











[1] 还 有 一 种 基本 类 型 是 returnAddress， 它 和 jst、 


fret、fet_w 指 令 一 起 ， 用 来 实现 finally 子 句 。 不 过 从 


Java 


条 指令 了 。 详 细 情 况 请 参考 第 10 章 内 容 。 
[2] 本 书 不 讨论 浮 点 数 细节 ， 如 在 内 存 中 的 编码 形式 
等 。 如 果 读者 需要 了 解 这 方面 的 知识 ， 可 以 阅读 


06 开始，Oracle 的 Java 编 译 器 已 经 不 再 使 用 这 三 


Java 虚 拟 机 规范 或 IEEE 754 规 范 的 相关 章节 。 


4.3 ”实现 运行 时 数据 区 


前 面 两 节 介绍 了 一 些 必要 的 理论 ， 并 且 定 义 了 
Object 结 构 体 。 本 节 将 实现 线程 私有 的 运行 时 数据 
区 。 下 和 耐 先 从 线程 开始 。 





4.3.1 ”线程 


在 ch04Njvmsrtda 目 录 下 创建 thread.go 文 件 ， 在 
其 中 定义 Thread 结 构 体 ， 代 码 如 下 : 


package rtda 
type Thread struct { 
pc int 
stack *Stack 
} 
func NewThread() *Thread {...} 
func (self *Thread) PC() int { return self.pc } // getter 
func (self *Thread) SetPC(pc int) { self.pc = pc } // setter 
func (self *Thread) PushFrame(frame *Frame) {...} 
func (self *Thread) PopFrame() *Frame {...} 
func (self *Thread) CurrentFrame() *Frame {...} 


目前 只 定义 了 pc 和 stack 两 个 字段 。pc 字 段 无 需 
解释 ，stack 字 段 是 Stack 结 构 体 〈Java 虐 拟 机 栈 ) 指 
针 。Stack 结 构 体 在 4.3.2 节 介绍 。 


和 扒 一 样 ，Java 虚 拟 机 规范 对 Java 虚 拟 机 栈 的 
约束 也 相当 宽松 。Java 虚 拟 机 栈 可 以 是 连续 的 空 


间 ， 也 可 以 不 连续 ;可 以 是 固定 大 小 ， 也 可 以 在 运 
行 时 动态 扩展 由 。 如 果 Java 虚 拟 机 栈 有 大 小 限制 ， 
且 执 行 线程 所 需 的 栈 空 间 超出 了 这 个 限制 ， 会 导致 
StackOverflowError 腊 第 抛 出 。 如 采 Java 虚 拟 机 栈 可 
以 动态 扩展 ， 但 是 内 存 已 经 耗 斥 ， 会 导致 
OutOfMemoryError 异 常 抛 出 。 


NewThread〈) 也 数 创建 Thread 实 例 的 代码 如 
下 : 


func NewThread() *Thread { 
return &Thread{ 
stack: newStack(1024), 


newStack () 函数 创建 Stack 结 构 体 实例 ， 它 的 
参数 表示 要 创建 的 Stack 最 多 可 以 容纳 多 少 帧 ，4.3.2 
节 将 给 出 这 个 函数 的 代码 。 这 里 暂时 将 它 赋值 为 


1024， 感 兴趣 的 读者 可 以 修改 我 们 的 命令 行 工具 ， 
添加 选项 来 指定 这 个 参数 。 








PushFrame () 和 PopFrame 〈) 方法 只 是 调用 
Stack 结 构 体 的 相应 方法 而 已 ， 代 码 如 下 : 





func (self *Thread) PushFrame(frame *Frame) { 
self.stack.push(frame) 


func (self *Thread) PopFrame() *Frame { 
return self.stack.pop() 


} 


CurrentFrame 〈) 方法 返回 当前 帧 ， 代 码 如 
下 : 





func (self *Thread) CurrentFrame() *Frame { 
return self.stack.top() 


} 


[1] “java 命令 提供 了 -Xss 选 项 来 设置 Java 虚 拟 机 栈 大 


4.3.2 Java 虚拟 机 栈 


如 前 所 述 ，Java 虚 拟 机 规范 对 Java 虚 拟 机 栈 的 
约束 非常 宽松 。 我 们 用 经 典 的 链表 (linked list) 数 
据 结构 来 实现 Java 虚 拟 机 栈 ， 这 样 栈 就 可 以 按 需 使 
用 内 存 空间 ， 而 且 弹 出 的 帧 也 可 以 及 时 被 Go 的 垃圾 
收集 器 回收 。 在 ch04\jvm\rtda 目 录 下 创建 
jvm_stack.go 文 件 ， 在 其 中 定义 Stack 结 构 体 ， 代 码 
如 下 : 





package rtda 
type Stack struct { 
maxSize uint 
size uint 
_top *Frame 
} 
func newStack(maxSize uint) *Stack {...} 
func (self *Stack) push(frame *Frame) {...} 
func (self *Stack) pop() *Frame {...} 
func (self *Stack) top() *Frame {...} 





maxSize 字 段 保 存 栈 的 容量 〈 最 多 可 以 容纳 多 
少 帧 )，size 字 段 保 存 栈 的 当前 大 小 ，_top 字 段 保 
存 栈 顶 指针 。newStack () 函数 的 代码 如 下 : 


func newStack(maxSize uint) *Stack { 
return &Stackt{ 
maxSize: maxSize, 


push《〈) 方法 把 帧 推 入 栈 顶 ， 代 人 码 如 下 : 


func (self *Stack) push(frame *Frame) { 
If self.size >= self.maxSize { 
panic("java.lang.StackOverflowError") 


If self,._ top != nil { 
frame.lower = self._top 


self. top = frame 
self.sizet+ 


} 


如 果 栈 已 经 满 了 ， 按 照 Java 虚 拟 机 规范 ， 应 该 


抛 出 StackOverflowError 寞 常 。 在 第 10 章 才 会 讨论 寞 





常 ， 这 里 先 调用 panic 〈) 函数 终止 程序 执行 。 
pop〈) 方法 把 栈 顶 帧 弹出 ， 代 码 如 下 : 


func (self *Stack) pop() *Frame { 
If self,. top == nil { 
panic("jvm stack is empty!") 


top := Self, top 
self._ top = top.lower 
top.lower = nil 
self.size-- 

return top 





如 果 此 时 栈 是 空 的 ， 肯 定 是 我 们 的 虚拟 机 有 
bug， 调 用 panic〈() 函数 终止 程序 执行 即 可 。 
top《〈) 方法 只 是 返回 栈 顶 帧 ， 但 并 不 弹出 ， 人 代码 如 
访 


func (self *Stack) top() *Frame { 
If self,. top == nil { 
panic("jvm stack is empty!") 


return self._top 


4.3.3 帧 


在 ch04ijvm\rtda 目 录 下 创建 frame.go 文 件 ， 在 其 
中 定义 Frame 结 构 体 ， 代 码 如 下 : 





package rtda 
type Frame struct { 


lower *Frame 
lJocalVars LocalVars 
operandStack *OperandStack 


func newFrame(maxLocals, maxStack uint) *Frame {...} 





Frame 结 构 体 暂时 也 比较 简单 ， 只 有 三 个 字 
段 ， 后 续 草 节 还 会 继续 完善 它 。lower 字 段 用 来 实现 
链表 数据 结构 ，localVars 字 段 保 存 局 部 变量 表 指 
针 ，operandStack 字 段 保 存 操作 数 栈 指 针 。 
NewFrame 〈) 函数 创建 Frame 实 例 ， 代 码 如 下 : 


func NewFrame(maxLocals, maxStack uint) *Frame { 
return &Frame{ 
localVars: newLocalVars(maxLocals), 


operandStack: newoOoperandStack(maxStack ) ， 


执行 方法 所 需 的 局 部 变量 表 大 小 和 操作 数 栈 深 
虐 是 由 编译 右 预 先 计 算 好 的 ， 存 储 在 class 文 件 
method_info 结 构 的 Code 属 性 中 ， 具 体 可 以 参考 3.4.5 


二 4 


Ho 


Thread、Stack 和 Frame 结 构 体 的 代码 都 已 经 给 
出 了 ， 根 据 代码 ， 可 以 画 出 Java 虚 拟 机 栈 的 链表 结 
构 ， 如 图 4-2 所 示 。 


Stack rT Frame rT Frame nn Frame 
_top lower lower 


lower 


图 4-2 使 用 链表 实现 Java 虚 拟 机 栈 


4.3.4 局 部 变量 表 


局 部 变量 表 是 按 索引 访问 的 ， 所 以 很 自然 ， 可 
以 把 它 想象 成 一 个 数组 。 根 据 Java 虚 拟 机 规范 ， 这 
个 数组 的 每 个 元 素 至 少 可 以 容纳 一 个 int 或 引用 值 ， 
两 个 连续 的 元 素 可 以 容纳 一 个 long 或 double 值 。 


那么 使 用 哪 种 Go 语言 数据 类 型 来 表示 这 个 数组 
呢 ? 最 容易 想到 的 是 [jint。Go 的 int 类 型 因 平台 而 
异 ， 在 64 位 系统 上 是 int64， 在 32 位 系统 上 是 int32， 
总 之 足够 容纳 Java 的 int 类 型 。 另 外 它 和 内 置 的 
uintptr 类 型 宽度 一 样 ， 所 以 也 足够 放下 一 个 内 存 地 
址 。 通 过 unsafe 包 可 以 拿 到 结构 体 实 例 的 地 址 ， 如 
下 所 示 : 








obj := &Object1 
ptr := uintptr(unsafe.Pointer(obj)) 


ref := int(ptr) 


但 遗憾 的 是 ，Go 的 垃圾 回收 机 制 并 不 能 有 效 处 
理 uintptr 指 针 。 也 就 是 说 ， 如 来 一 个 结构 体 实例 ， 
除了 uintptr 类 型 指针 你 存 它 的 地 址 之 外 ， 其 他 地 方 
都 没有 引用 这 个 实例 ， 它 束 会 被 当 作 垃圾 回收 。 








另外 一 个 方案 是 用 [Jinterface{} 类 型 ， 这 个 方案 
在 实现 上 没有 问题 ， 只 是 写 出 来 的 代码 可 读 性 太 
差 。 第 三 种 方案 是 定义 一 个 结构 体 ， 让 它 可 以 同时 
容纳 一 个 int 值 和 一 个 引用 值 。 这 里 将 使 用 第 三 种 方 
案 。 在 ch04\rtda 目 录 下 创建 slot.go 文 件 ， 在 其 中 定 
义 Slot 结 构 体 ， 代 码 如 下 : 











package rtda 

type Slot Struct { 
num int32 
ref *Object 


num 字 段 存 放 整 数 ，ref 字 段 存 放 引 用 ， 刚 好 满 
足 我 们 的 需求 。 下 面 用 它 来 实现 局 部 变量 表 。 在 
ch04\rtda 目 录 下 创建 local_vars.go 文 件 ， 在 其 中 定义 


LocalVars 类 型 ， 代 人 码 如 下 : 


package rtda 
import "math" 
type LocalVars [|]Slot 


继续 编辑 local_vars.go 文 件 ， 在 其 中 定义 
newLocalVars () 函数 ， 代 码 如 下 : 


func newLocalVars(maxLocals uint) LocalVars { 
If maxLocals > 0f{ 
return make([]Slot, maxLocals) 


return nil 


上 


newLocalVars 〈) 函数 创建 LocalVars 实 例 ， 代 
码 比 较 简 单 ， 这 里 就 不 多 解释 了 。 


在 第 5 革 大 家 会 看 到 ， 操 作 局 部 变量 表 和 操作 
数 栈 的 指令 都 是 隐 含 关 型 信息 的 。 下 面 给 LocalVars 
类 型 定义 一 些 方法 ， 用 来 存 取 不 同类 型 的 变量 。int 
量 最 简单 ， 直 接 存 取 即 可 。 











) 导 





func (self LocalVars) SetInt(index uint, val int32) { 
self[index].num = val 

} 

func (self LocalVars) GetInt(index uint) int32 { 
return self[index].num 





float 变 量 可 以 先 转 成 int 类 型 ， 然 后 按 int 变 量 来 
处 理 。 





func (self LocalVars) SetFloat(index uint, val float32) { 
bits := math.Float32bits(val) 
self[index] .num = int32(bits) 


func (self LocalVars) GetFloat(index uint) float32 { 
bits := uint32(self[index].num) 
return math.Float32frombits(bits) 








long 变 量 则 需要 拆 成 两 个 int 变 量 。 





func (self LocalVars) SetLong(index uint, val int64) { 
self[index] .num = int32(val) 
self[index+1] .num = int32(val >> 32) 


} 

func (self LocalVars) GetLong(index uint) int64 { 
low := uint32(self[index].num) 
high := uint32(self[index+1].num) 
return int64(high)<<32 | int64(low) 





double 变 量 可 以 先 转 成 long 类 型 ， 然 后 按照 
long 变 量 来 处 理 。 





func (self LocalVars) SetDouble(index uint, val float64) { 
bits := math.Float64bits(val) 
self.SetLong(index, int64(bits)) 
} 
func (self LocalVars) GetDouble(index uint) float64 { 
bits := uint64(self.GetLong(index)) 
return math.Float64frombits(bits) 











最 后 是 引用 值 ， 也 比较 简单 ， 直 接 存 取 即 可 。 





func (self LocalVars) SetRef(index uint, ref *Object) { 
self[index|].ref = ref 


} 
func (self LocalVars) GetRef(index uint) *Object { 
return self[index].ref 


} 


二 一 


请 读者 注意 ， 我 们 并 没有 真 的 对 boolean、 
byte、short 和 char 类 型 定义 存 取 方 法 ， 这 些 类 型 的 
值 都 可 以 转换 成 int 值 类 来 处 理 。 下 面 我 们 来 实现 操 
作 数 栈 。 


4.3.5 ”操作 数 栈 


操作 数 栈 的 实现 方式 和 局 部 变量 表 类 似 。 在 
ch04\rtda 目 录 下 创建 operand_stack.go 文 件 ， 在 其 中 
定义 OperandStack 结 构 体 ， 代 人 码 如 下 : 


package rtda 

import "math" 

type OperandStack struct { 
size Uint 
slots []Slot 

} 


操作 数 栈 的 大 小 是 编译 器 已 经 确定 的 ， 所 以 可 
以 用 [Slot 实现 。size 字 段 用 于 记录 栈 顶 位 置 。 继 续 
编辑 operand_stack.go， 在 其 中 实现 
newOperandStack 〈) 函数 ， 代 码 如 下 : 


func newOperandStack(maxStack uint) *operandStack { 
If maxStack > 0 { 
return &operandStackt 
slots: make([]SLot，maxStack )， 


了 


return nil 


和 





代码 也 比较 简单 ， 在 此 就 不 多 解释 了 。 和 局 部 
变量 表 类 似 ， 需 要 定义 一 些 方法 从 操作 数 栈 中 弹 
出 ， 或 者 往 其 中 推 入 各 种 类 型 的 变量 。 先 看 最 简单 
的 int 变 量 。 





func (self *OperandStack) PushIint(val int32) { 
self.slots[self.sizel].num = val 
self.sizett+ 

} 

func (self *OperandStack) PopInt() int32 { 
self.size-- 
return self.slots[self.sizel].num 


: 


PushInt〈) 方法 往 栈 顶 放 一 个 int 变 量 ， 然 后 把 
size 加 1。PopInt〈) 方法 则 恰好 相反 ， 先 把 size 减 
1， 然 后 返回 变量 值 。float 变 量 还 是 先 转 成 int 类 
型 ， 然 后 按 int 变 量 处 理 。 





func (self *OperandStack) PushFloat(val float32) { 
bits := math.Float32bits(val) 
self.slots[self.sizel].num = int32(bits) 
self.sizett+ 


func (self *OperandStack) PopFloat() float32 { 
self.size-- 
bits := uint32(self.slots[self.sizel].num) 


return math.Float32frombits(bits) 





把 long 变 量 推 入 栈 顶 时 ， 要 拆 成 两 个 int 变 量 ， 
弹出 时 ， 先 弹出 两 个 int 变 量 ， 然 后 组 装 成 一 个 long 
变量 ， 





func (self *OperandStack) PushLong(val int64) { 
self.slots[self.sizel.num = int32(val) 
self.slots[self.size+1] .num = int32(val >> 32) 
self.size += 2 


func (self *OperandStack) PopLong() int64 { 
self.size -= 2 
low := uint32(self.slots[self.sizel].num) 
high := uint32(self.slots[self.size+1].num) 
return int64(high)<<32 | int64(low) 





double 变 量 先 转 成 long 类 型 ， 然 后 按 long 变 量 
处 理 。 





func (self *OperandStack) PushDouble(val float64) { 
bits := math.Float64bits(val) 
self.PushLong(int64(bits)) 


func (self *OperandStack) PopDouble() float64 { 
bits := uint64(self.PopLong()) 
return math.Float64frombits(bits) 

} 











最 后 看 引用 类 型 ， 代 人 码 如 下 : 





func (self *OperandStack) PushRef(ref *Object) { 
self.slots[self.sizel.ref = ref 
self.sizet++ 


} 

func (self *OperandStack) PopRef() *Object { 
self.size-- 
ref := self.slots[self.sizel].ref 
self.slots[self.sizel].ref = nil 
return ref 





PushRef() 方法 比较 简单 ， 此 处 不 做 太 多 解 
释 。PopRef() 方法 需要 说 明 一 点 : 弹出 引用 后 ， 
把 Slot 结 构 体 的 ref 字 上 段 设置 成 nll， 这 样 做 是 为 了 帮 
助 Go 的 垃圾 收集 器 回收 Object 结 构 体 实例 。 





全 此 ， 局 部 变量 表 和 操作 数 栈 都 准备 好 了 。 仅 


通过 代码 来 理解 它们 可 能 不 是 很 和 直观， 下面 我 们 将 
通过 一 个 具体 的 例子 来 分 析 局 部 变量 表 和 操作 数 的 
使 用 。 


4.3.6 ”局 部 变量 表 和 操作 数 栈 实例 分 析 


以 圆 形 的 周 长 公 去 为 例 进行 分 机 ， 下 面 是 Java 
方法 的 代码 。 





public static float circumference(float r) { 
float pi = 3.14f; 
float area = 2 * pi * r; 
return area; 


} 





上 面 的 方法 会 被 javac 编 诺 套 编译 成 如 下 字 贡 
码 : 





00 1dc #4 
02 fstore 1 
03 fconst_ 2 
04 fload 1 
05 fmul 

06 fload 0 
07 fmul 

08 fstore 2 
09 fload 2 
10 return 


| 


下 面 分 析 这 段 字 节 码 的 执行 。 
circumference〈) 方法 的 局 部 变量 表 大 小 是 3， 操 作 
数 栈 深度 是 2。 假 设 调用 方法 时 ， 传 递 给 它 的 参数 
是 1.6f， 方 法 开始 执行 前 ， 帧 的 状态 如 图 4-3 所 示 。 


Instruction Local Vars Operand Stack 
#0 #1 #2 
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图 4-3 ”circumference () 方法 执行 示意 图 (1) 


和 大 大 


第 一 条 指令 是 ldc， 它 把 3.14f 推 入 栈 顶 ， 如 图 4- 
4 所 示 。 


Instructions Local Vars Operand Stack 


bottom 
pc 


a ES 症 二 sa 玫 到 
el 


图 4-4 circumference () 方法 执行 示意 图 (2) 


， 上 面 是 局 部 变量 表 和 操作 数 栈 过 去 的 状 
态 ， 最 下 面 是 当前 状态 。 接 着 是 fstore_1 指 令 ， 它 把 
栈 顶 的 3.14f 弹 出 ， 放 到 #1 号 局 部 变量 中 ， 如 图 4-5 
所 示 。 





fconst_2 指 令 把 2.0f 推 到 栈 顶 ， 如 图 4-6 所 示 。 






Instructions Local Vars Operand Stack 
#0 #1 #2 bottom 

pe 

一 一 一 一 由 一 一 一 





图 4-5 ”circumference () 方法 执行 示意 图 (3) 


Instructions Local Vars Operand Stack 
#0 #1 #2 bottom 


图 4-6 ”circumference () 方法 执行 示意 图 (4) 


fload_1 指 令 把 #1 号 局 部 变量 推 入 栈 顶 ， 如 图 4- 


7 所 示 。 
Instructions Local Vars Operand Stack 
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图 4-7 circumference () 方法 执行 示意 图 (5) 


fmul 指 令 执行 浮 点 数 乘法 。 它 把 栈 顶 的 两 个 浮 
点 数 弹出 ， 相 乘 ， 然 后 把 结果 推 入 栈 顶 ， 如 图 4-8 
所 示 。 


fload_0 指 令 把 #0 号 局 部 变量 推 入 栈 顶 ， 如 图 4- 


9 所 示 。 
fmul 继 续 来 法 计算 ， 如 图 4-10 所 示 。 


fstore_2 指 令 把 操作 数 栈 顶 的 float 值 弹出 ， 放 入 
#2 号 局 部 变量 表 ， 如 图 4-11 所 示 。 
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circumference () 方法 执 和 


图 4-10 
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图 4-11 circumference () 方法 执行 示意 图 (9) 


fload_2 指 令 把 #2 号 局 部 变量 推 入 操作 数 栈 顶 ， 
如 图 4-12 所 示 。 
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图 4-12” circumference () 方法 执行 示意 图 ( 


~ 
OO 
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最 后 freturn 指 令 把 操作 数 栈 顶 的 float 变 量 弹 
出 ， 返 回 给 方法 调用 者 ， 如 图 4-13 所 示 。 





如 果 上 面 的 例子 理解 起 来 有 点 困难 ， 请 不 要 担 
心 。 这 里 重点 看 局 部 变量 表 和 操作 数 栈 的 用 法 就 可 
以 了 ， 后 面 的 章节 会 详细 介绍 Java 虚 拟 机 指令 集 。 
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circumference () 方法 执行 示意 图 (11) 


图 4-13 


4.4 测试 本 章 代 码 


本 节 简 单 测试 局 部 变量 表 和 操作 数 栈 的 用 法 ， 
在 下 一 章 它 们 才 会 真正 派 上 用 场 。 打 开 
ch04\main.go 文 件 ， 修 改 import 语 句 ， 代 人 码 如 下 : 


package main 

import "fmt" 

import "jvmgo/ch04/rtda" 

func main() {...} 

func startJVM(cmd *Cmd) {...} 


main 〈) 方法 不 变 ， 修 改 startUJVM 方 法 ， 代 码 
如 下 : 


func startJVM(cmd *Cmd) { 
frame := rtda.NewFrame(100, 100) 
testLocalVars(frame.LocalVars()) 
testOperandstack(frame.Operandstack()) 


testLocalVars 〈) 函数 测试 局 部 变量 ， 代 码 如 





func testLocalVars(vars rtda.LocalVars) { 
vars.SetIint(0, 100) 
vars.SetInt(1, -100) 
vars.SetLong(2, 2997924580) 
vars.SetLong(4, -2997924580) 
vars.SetFloat(6, 3.1415926) 
vars.SetDouble(7, 2.71828182845) 


vars.SetRef( 


println(vars. 
println(vars. 
println(vars. 
println(vars. 
println(vars. 
println(vars. 
println(vars. 





9, nil) 
GetInt(0)) 
GetInt(1)) 
GetLong(2)) 
GetLong(4)) 
GetFloat(6)) 
GetDouble(7)) 
GetRef(9)) 


testOperandStack〈) 函数 测试 操作 数 栈 ， 代 码 





func testoperandStack(ops *rtda,OperandStack) { 
ops.PushInt(100) 
ops.PushInt(-100) 
ops.PushLong(2997924580) 
ops.PushLong(-2997924580) 
ops.PushFloat(3.1415926) 
ops.PushDouble(2.71828182845) 
ops.PushRef (nil) 


println(ops. 
println(ops. 
println(ops. 
println(ops. 
println(ops. 


PopRef()) 
PopDouble( )) 
PopFloat( ) ) 
PopLong ( ) ) 
PopLong ( ) ) 


println(ops.PopInt()) 
println(ops.PopInt()) 
} 





打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 代 
人 码 : 





go install jvmgo\ch04 





编译 成 功 后 ， 在 D: \go\wworkspace\bin 目 录 下 出 
现 ch04.exe 文 件 。 执 行 ch04.exe， 运 行 结果 如 图 4-14 
所 示 。 
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图 4-14 ”ch04.exe 的 运行 结果 


4.5 ”本 章 小 结 


本 章 介 绍 了 运行 时 数据 区 ， 初 步 实 现 了 
Thtead、Stack、Frame、OpetandStack 和 LocalVats 等 
线程 私有 的 运行 时 数据 区 。 下 一 草 将 实现 字 节 码 解 
释 器 ， 到 时 候 方 法 就 可 以 在 我 们 的 Java 虚 拟 机 里 运 
行 了 。 


第 5 章 ”指令 集 和 解释 器 


由 第 3 草 可 知 ， 编 译 之 后 的 Java 方 法 以 字 节 码 的 
形式 存储 在 class 文 件 中 。 在 第 4 章 中 ， 初 步 实 现 了 
Java 诬 拟 机 栈 、 帧 、 操 作 数 栈 和 局 部 变量 表 等 运行 
时 数据 区 。 本 章 将 在 前 两 章 的 基础 上 编写 一 个 简单 
的 解释 器 ， 并 且 实 现 大 约 150 条 指令 。 在 后 面 的 章 
节 中 ， 会 不 断 改进 这 个 解释 器 ， 让 它 可 以 执行 更 多 
的 指令 。 


在 开始 阅读 本 章 之 前 ， 先 把 本 章 的 目录 结构 准 
备 好 。 复 制 ch04 目 录 ， 改 名 为 ch05。 修 改 main.go 等 
文件 ， 把 import 语 和 句 中 的 ch04 都 改 成 ch05。 在 ch05 目 
录 中 创建 instructions 子 目录 。 现 在 我 们 的 目录 结构 
看 起 来 应 该 是 下 面 这 样 : 


D:\go\workspace\src 
|-jvmgo 
|-cho1 ~ chg04 
| -ch05 
|-classfile 
-classpath 
-Instructions 


5.1 字 节 人 码 和 指令 集 


Java 虚 拟 机 顾名思义 ， 就 是 一 台 虚 拟 的 机 器 ， 
而 学 市 码 〈bytecode) 了 驶 是 运行 在 这 合 虚 拟 机 左上 
的 机 器 码 。 我 们 已 经 知道 ， 每 一 个 类 或 者 接口 都 会 
被 Java 编 译 器 编译 成 一 个 class 文 件 ， 类 或 接口 的 方 
法 信息 就 放 在 class 文 件 的 method_info 结 构 中 |。 
如 果 方 法 不 是 抽象 的 ， 也 不 是 本 地 方法 ， 方 法 的 
Java 代 码 就 会 被 编译 器 编译 成 字 节 码 〈 即 使 方法 是 
空 的 ， 编 译 器 也 会 生成 一 条 retum 语 句 ) ， 存 放 在 
method_info 结 构 的 Code 属 性 中 。 仍 以 第 3 章 的 
ClassFileTest 类 为 例 ， 其 main〈) 方法 如 图 5-1 所 











人 小。 
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图 5-1 ”用 classpy 观 察 方法 字 节 码 


节 码 中 存放 编码 后 的 Java 虚 拟 机 指令 。 每 条 
指令 都 以 一 个 单字 节 的 操作 码 〈opcode) 开头 ， 这 
就 是 字 节 码 名 称 的 由 来 。 由 于 只 使 用 一 字 节 表示 操 
作 码 ， 显 而 易 见 ，Java 虚 拟 机 最 多 只 能 支持 256 (28 
) 条 指令 。 到 第 八 版 为 止 ，Java 虚 拟 机 规范 已 经 定 
义 了 205 条 指令 ， 操 作 码 分 别 是 0(0x00〉 到 
202 (0xCA) 、254 (0xFE) 和 255 (COxFF) 。 这 





205 条 指令 构成 了 Java 虚 拟 机 的 指令 集 (instruction 
set) 。 和 汇编 语言 闫 似 ， 为 了 便于 记忆 ，Java 虚 拟 
机 规范 给 每 个 操作 码 都 指定 了 一 个 助 记 符 
(mnemonic) 。 比 如 操作 码 是 0x00 这 条 指令 ， 因 为 
它 什 么 也 不 做 ， 所 以 它 的 助 记 符 是 nop (no 


operation ) 。 











Java 虚 拟 机 使 用 的 是 变 长 指令 ， 操 作 码 后 面 可 
以 跟 零 字 贡 或 多 字 节 的 操作 数 《operand) 。 如 果 把 
旧 令 想象 成 函数 的 话 ， 操 作 数 就 是 它 的 参数 。 为 了 
让 编码 后 的 字 节 码 更 加 紧凑 ， 很 多 操作 码 本 身 就 隐 
含 了 操作 数 ， 比 如 把 常数 0 推 入 操作 数 栈 的 指令 是 
iconst_0。 下 面 通过 具体 的 例子 来 观察 Java 虚 拟 机 指 
令 。 图 5-2 为 ClassFileTestmain 〈() 方法 的 第 一 条 指 


今 。 
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图 5-2 ”用 classpy 观 察 getstatic 指 邻 





可 以 看 到 ， 该 指令 的 操作 码 是 0xB2， 助 记 符 是 
getstatic。 它 的 操作 数 是 0x0002， 代 表 律 量 池 里 的 


入 一 人、 卜 


条- 一 小 吊 星 。 





在 第 4 章 中 讨论 过 ， 操 作 数 栈 和 局 部 变量 表 只 
存放 数据 的 值 ， 并 不 记录 数据 类 型 。 结 末 束 是 : 指 
令 必 须知 道 目 己 在 操作 什么 类 型 的 数据 。 这 一 点 也 
直接 反映 在 了 操作 码 的 助 记 符 上 。 例 如 ，iadd 指 令 
束 是 对 int 值 进行 加 法 操作 ;，dstore 指 令 把 操作 数 栈 
顶 的 double 值 弹出 ， 存 储 到 局 部 变量 表 中 ; areturn 
从 方法 中 返回 引用 值 。 也 就 是 说 ， 如 末 革 类 指令 可 
以 操作 不 同类 型 的 变量 ， 则 助 记 符 的 第 一 个 字母 表 








示 变 量 类 型 。 


如 表 5-1 所 示 。 


表 5-1 


助 记 符 首 字母 


助 记 符 首 字母 和 变量 


数据 类 型 


Teference 


助 记 符 首 字母 和 变量 关 型 的 对 应 关系 


类 型 对 应 表 


例 子 


aload 、astore 、areturn 





byte/boolean 


bipush、baload 





char 


double 


caload、castore 


dload、dstore 、dadd 





float 


fload、fstore、fadd 





int 


iload 、istore 、iadd 
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long 


short 








load、l1store 、ladd 


sipush、 sastore 


Java 虚 拟 机 规范 把 已 经 定义 的 205 条 指令 按 用 
途 分 成 了 11 类 ， 分别 是 : 常量 (constants〉 指令 、 
加 载 (loads〉 指令 、 存 储 〈stores) 指令 、 操 作 数 
栈 (stack) 指令 、 数 学 (math) 指令 、 转 换 


Cconversions) 指令 、 比 较 (comparisons 〉 指令 、 


控制 (control 指令 、 引 用 (references) 指令 、 


扩 


展 (extended) 指令 和 保留 (reserved) 指令 。 


保留 指令 一 共有 3 条 。 其 中 一 条 是 留 给 调试 器 
的 ， 用 于 实现 断 点 ， 操 作 码 是 202(0xCA) ， 助 记 
从 是 breakpoint。 男 外 两 条 留 给 Java 虚 拟 机 实现 内 部 
使 用 ， 操 作 码 分 别 是 254 (0xFE)〉 和 266 (0xFF) ， 
助 记 符 是 impdep1 和 impdep2。 这 三 条 指令 不 允许 出 
现在 class 文 件 中 。 








本 章 将 要 实现 的 指令 涉及 11 类 中 的 9 类 。 在 第 9 
章 讨论 本 地 方法 调用 时 会 用 到 保留 指令 中 的 
impdepl1 指 令 ， 引 用 指令 则 分 布 在 第 6、 第 7、 人 第 8、 
第 10 草 等 章节 中 。 为 了 便于 管理 ， 我 们 把 每 种 指令 
的 源 文 件 都 放 在 各 目的 包 里 ， 所 有 指令 都 共用 的 代 
码 则 放 在 base 包 里 。 因 此 ch05\instructions 目 录 下 会 
有 如 下 10 个 子 目录 : 




















D:\go\workspace\src 
|-jvmgo 
| -ch05 


|-classfile 
|-classpath 
|-rtda 
|-instructions 
| -base 
|-comparisons 
|-constants 
|-control 
|-conversions 
| -extended 
| -Loads 
|-math 
|-stack 
|-stores 





请 读者 先 创 建 好 这 些 目录 。 


[1 如 果 读 者 已 经 忘记 了 class 文 件 结构 ， 可 以 回 到 第 


3 章 复 习 。 


5.2 ”指令 和 指令 解码 


Java 虚 拟 机 规范 的 2.11 节 介绍 了 Java 虚 拟 机 解 
释 器 的 大 致 逻辑 ， 如 下 所 示 : 


do { 
atomically calculate pc and fetch opcode at pc; 
If (operands) fetch operands; 
execute the action for the opcode; 

} while (there is more to do); 


每 次 循环 都 包含 三 个 部 分 : 计算 pc、 指 令 解 
码 、 指 令 执行 。 可 以 把 这 个 逻辑 用 Go 语言 写成 一 个 
for 循 环 ， 里 面 是 个 大 大 的 switch-case 语 句 。 但 这 样 
的 话 ， 代 码 的 可 读 性 将 非 帝 震 。 所 以 采用 另外 一 种 
方式 : 把 指令 抽象 成 接口 ， 解 码 和 执行 逻辑 写 在 具 
体 的 指令 实现 中 。 这 样 编写 出 的 解释 右 殊 和 Java 虚 
拟 机 规范 里 的 伪 代 码 一 样 测 单 ， 代 码 如 下 : 


for { 
pc := calculatePC() 
opcode := bytecode[pc] 
inst := createInst(opcode) 
inst.fetchOperands(bytecode) 
inst.execute() 


上 面 给 出 的 仍然 是 伪 代 码 。 将 在 5.12 节 编写 解 
释 器 代码 ， 在 5.3~5.11 节 分 类 实现 具体 的 指令 。 本 
节 先 定义 指令 接口 ， 然 后 定义 一 个 结构 体 用 来 辅助 
指令 解码 。 














5.2.1 _ Instruction 接口 


在 ch05\instructions\base 目 录 下 创建 
instruction.go 文 件 ， 在 其 中 定义 Instruction 接 口 ， 代 
人 码 如 下 : 


package base 

import "jvmgo/cho5/rtda" 

type Instruction interface 
Fetchoperands(reader *BytecodeReader) 
Execute(frame *rtda,Frame) 


} 


FetchOperands () 方法 从 字 节 码 中 提取 操作 
数 ，Execute〈) 方法 执行 指令 逻辑 。 有 很 多 指令 的 
操作 数 都 是 类 似 的 。 为 了 避免 重复 代码 ， 按 照 操 作 
数 类 型 定义 一 些 结构 体 ， 并 实现 FetchOperands () 
方法 。 这 相当 于 Java 中 的 抽象 类 ， 具 体 的 指令 继承 
这 些 结构 体 ， 然 后 专注 实现 Execute() 方法 即 可 。 





在 instruction.go 文 件 中 定义 
NoOperandsInstruction 结 构 体 ， 代 人 码 如 下 : 


type NoOperandsInstruction struct {} 





NoOperandsInstruction 表 示 没 有 操作 数 的 指 
令 ， 所 以 没有 定义 任何 字段 。FetchOperands () 方 
法 目 然 也 是 空空 如 也 ， 什 么 也 不 用 读 ， 代 码 如 下 : 


func (self *NoOperandsInstruction) Fetchoperands(reader *Bytec 
// nothing to do 
} 


继续 编辑 instruction.go 文 件 ， 在 其 中 定义 
BranchInstruction 结 构 体 ， 代 人 码 如 下 : 





type BranchInstruction Struct { 
Offset int 


二 


BranchInstruction 表 示 跳 转 指 令 ，Offset 字 段 存 


放 跳 转 偏 移 量 。FetchOperands () 方法 从 字 节 码 中 


读 取 一 个 uint16 整 数 ， 转 成 int 后 赋 给 Offset 字 段 。 代 
人 码 如 下 : 


func (self *BranchInstruction) FetchOperands(reader *BytecodeR 
self.offset = int(reader.ReadInt16()) 
} 


继续 编辑 instruction.go 文 件 ， 在 其 中 定义 
Index8Instruction 结 构 体 ， 代 码 如 下 : 


type Index8Instruction Struct { 
Index uint 
小 








存储 和 加 载 类 指令 需要 根据 索引 存 取 局 部 变量 
表 ， 索 引 由 单字 节操 作 数 给 出 。 把 这 闫 指令 抽象 成 








Index8Instruction 结 构 体 ， 用 Index 字 段 表 示 局 部 弯 


量 表 索 引 。FetchOperands 〈) 方法 从 字 节 码 中 该 取 
一 个 int8 整 数 ， 转 成 uint 后 赋 给 Index 字 上段。 代码 如 
下 : 


func (self *Index8Instruction) Fetchoperands(reader *Bytecoder 
self.Index = uint(reader.ReadUint8()) 


} 


最 后 在 instruction.go 文 件 中 定义 
Index16Instruction 结 构 体 ， 代 码 如 下 : 


type Index16Instruction Struct { 
Index uint 


} 





有 一 些 指令 需要 访问 运行 时 和 常量 池 ， 常 量 池 索 
引 由 两 字 节 操作 数 给 出 。 把 这 类 指令 抽象 成 
Index16Instruction 结 构 体 ， 用 Index 字 段 表 示 常 量 池 


索引 。FetchOperands () 方法 从 字 市 码 中 读 取 一 个 








uint16 整 数 ， 转 成 uint 后 赋 给 Index 字 段 。 代 码 如 
下 : 





func (self *Index16Instruction) Fetchoperands(reader *Bytecode 
self.Index = uint(reader.ReadUint16()) 
} 





指令 接口 和 “抽象 ”指令 定义 好 了 ， 下 面 来 看 
BytecodeReader 结 构 体 。 


5.2.2 BytecodeReader 


在 ch05\instructions\base 上 日 录 下 创建 
bytecode_reader.go 文 件 ， 在 其 中 定义 
BytecodeReader 结 构 体 ， 代 码 如 下 : 


package base 

type BytecodeReader struct { 
code [jbyte 
pc int 


} 


code 字 段 存 放 字 节 码 ，pc 字 段 记 录 读 取 到 了 哪 
个 字 贡 。 为 了 避免 每 次 解码 指令 者 新 创建 一 个 
BytecodeReader 实 例 ， 给 它 定 义 一 个 Reset〈) 方 
法 ， 代 码 如 下 : 








func (self *BytecodeReader) Reset(code [|]byte, pc int) { 
self.code = code 
self.pc = pc 





下 面 实现 一 系列 的 Read 〈) 方法 。 先 看 最 简单 
的 ReadUint8〈) 方法 ， 代 人 码 如 下 : 





func (self *BytecodeReader) ReadUint8() uint8 { 
i := self.code[self.pcl] 
self .pc+t+ 
return i 





ReadInt8 () 方法 调用 ReadUint8() ， 然 后 把 
读 取 到 的 值 转 成 int8 返 回 ， 代 码 如 下 : 





func (self *BytecodeReader) ReadInt8() int8 { 
return int8(self.ReadUint8()) 
} 





ReadUint16 〈) 连续 读 取 两 字 节 ， 代 码 如 下 : 





func (self *BytecodeReader) ReadUint16() uint16 { 
byte1 := uint16(self.ReadUint8()) 
byte2 := uint16(self.ReadUint8()) 
return (byte1 << 8) | byte2 

} 


Ce | 


ReadInt16() 方法 调用 ReadUint16 () ， 然 后 
把 读 取 到 的 值 转 成 int16 返 回 ， 代 人 码 如 下 : 





func (self *BytecodeReader ) ReadInt16() Int16 { 
return int16(self.ReadUint16()) 








ReadInt32 〈) 方法 连续 读 取 4 字 节 ， 代 码 如 
下 : 





func (self *BytecodeReader) ReadInt32() int32 { 
byte1 := int32(self.ReadUint8()) 
byte2 := int32(self.ReadUint8()) 
byte3 := int32(self.ReadUint8()) 
byte4 := int32(self.ReadUint8()) 
return (byte1 << 24) | (byte2 << 16) | (byte3 << 8) | byte4 





还 需要 定义 两 个 方法 : ReadInt32s() 和 
SkipPadding () 。 这 两 个 方法 只 有 tableswitch 和 
lookupswitch 指 令 使 用 ， 这 两 条 指令 时 再 给 出 
1 





在 接 下 来 的 9 个 小 节 中 ， 将 按照 分 类 依次 实现 
约 150 条 指令 ， 占 整个 指令 集 的 3/4。 读 者 干 万 不 要 
匀 Q150 这 个 数字 吓 倒 ， 因 为 很 多 指令 其 实 古 非常 相 
似 的 。 比 如 iload、lload、fload、dload 和 aload 这 5 条 
指令 ， 除 了 操作 的 数据 类 型 不 同 以 外 ， 代 码 几乎 一 
样 。 再 比如 iload_0、iload_1、iload_2 和 iload_3 这 四 
条 指令 ， 只 是 iload 指 令 的 特例 〈 局 部 变量 表 索 引 隐 


售 在 操作 码 中 ) ， 操 作 馆 辑 完全 一 样 。 

















如 果 逐 一 列 出 这 150 余 条 指令 的 代码 ， 既 枯燥 
乏味 ， 也 相当 浪费 纸张 。 为 了 节约 篇 幅 ， 只 讨论 一 
些 具 有 代表 意义 的 指令 的 实现 代码 ， 从 这 些 指令 可 
以 很 容易 想象 到 其 他 指令 的 实现 。 附 录 A 给 出 了 完 
整 的 指令 集 列 表 ， 里 面 有 每 个 指令 的 操作 码 、 助 记 
符 和 本 书 中 实现 它们 的 章节 ， 以 方便 读者 参考 。 











5.3 ”和 量 指令 


第 量 指令 把 第 量 推 入 操作 数 栈 项 。 和 音量 可 以 来 
自 三 个 地 方 : 隐 舍 在 操作 码 里 、 操 作 数 和 运行 时 常 
量 池 。 常 量 指令 共有 21 条 ， 本 节 实 现 其 中 的 18 条 。 
另外 3 条 是 ldc 系 列 指令 ， 用 于 从 运行 时 常量 池 中 加 


载 币 量 ， 将 在 第 6 草 介 绍 。 


5.3.1 ”nop 指令 


nop 指 令 是 最 简单 的 一 条 指令 ， 因 为 它 什 么 也 
不 做 。 在 ch05\instructions\constants 目 录 下 创建 
nop.go 文 件 ， 在 其 中 实现 nop 指 令 ， 代 码 如 下 : 





package constants 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Do nothing 

type NOP struct{ base.NoOperandsInstruction } 

func (self *NOP) Execute(frame *rtda.Frame) { 
// 什么 也 不 用 做 





se 


这 一 系列 指令 把 隐 售 在 操作 人 码 中 的 ! 


const 系 列 指令 


操作 数 栈 项 。 
建 const.go 文 件 ， 在 其 中 定义 15 条 指令 ， 代 人 码 如 


下 





种 量 值 推 入 


在 ch05\instructions\constants 目 录 下 创 





package constants 
import "jvmgo/cho5/instructions/base" 
import "jvmgo/cho5/rtda" 
ACONST_NULL struct{ base.NoOperandsInstruction } 
struct{ base.NoOperandsInstruction 
struct{ base.NoOperandsInstruction 
struct{ base.NoOperandsInstruction 
struct{ base.NoOperandsInstruction 
struct{ base.NoOperandsInstruction 
ICONST_M1 struct{ base.NoOperandsInstruction } 


type 
type 
type 
type 
type 
type 
type 
type 
type 
type 
type 
type 
type 
type 
type 


DCONST_0 
DCONST_1 
FCONST_0O 
FCONST_1 
FCONST_2 


ICONST_0O 
ICONST_1 
ICONST_2 
ICONST_3 
ICONST_4 
ICONST_5 
LCONST_0O 
LCONST_1 


structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 


base. 
base. 
base. 
base. 
base. 
base. 
base. 
base. 


NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 


HI 


ccc 





以 3 条 指令 为 例 进行 说 明 。aconst_null 指 令 把 


null 引 用 推 入 操作 数 栈 项 ， 代 码 如 下 : 





func (self *ACONST_NULL) Execute(frame *rtda.Frame) { 
frame.OperandSstack().PushRef (nil) 





dconst_0 指 令 把 double 型 0 推 入 操作 数 栈 顶 ， 代 
公 如 下 : 





func (self *DCONST_0) Execute(frame *rtda.Frame) { 
frame,OperandStack( ) .PushDouble(0.0) 
} 





iconst_m1 指 令 把 int 型 -1 推 入 操作 数 栈 顶 ， 代 码 
如 下 : 





func (self *ICONST_M1) Execute(frame *rtda.Frame) { 
frame.OperandSstack().PushInt(-1) 
} 





5.3.3 ”bipush 和 sipush 指 令 


bipush 指 令 从 操作 数 中 获取 一 个 byte 型 整数 ， 
扩展 成 int 型 ， 然 后 推 入 栈 顶 。sipush 指 令 从 操作 数 
中 获取 一 个 short 型 整数 ， 扩 展 成 int 型 ， 然 后 推 入 栈 
顶 。 在 ch05\instructionsNconstants 目 录 下 创建 
ipush.go 文 件 ， 在 其 中 定义 bipush 和 sipush 指 令 ， 代 
人 码 如 下 : 


package constants 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/cho5/rtda" 

type BIPUSH struct { val int8 } // Push byte 
type SIPUSH struct { val int16 } // Push short 


以 bipush 指 令 为 例 ，FetchOperands () 和 
Execute〈) 方法 的 代码 如 下 : 


func (self *BIPUSH) Fetchoperands(reader *base.BytecodeReader) 
self.val = reader .ReadInt8() 


} 

func (self *BIPUSH) Execute(frame *rtda.Frame) { 
i := int32(self.val) 
frame.OperandSstack().PushInt(i) 


5.4 加 载 指令 








加 载 指令 从 局 部 变量 表 获 取 变 量 ， 然 后 推 入 操 
作 数 栈 顶 。 加 载 指令 共 33 条 ， 按 照 所 操作 变量 的 类 
型 可 以 分 为 6 类 : aload 系 列 指令 操作 引用 类 型 变 
量 、dload 系 列 操作 double 类 型 变量 、fload 系 列 操作 
float 变 量 、iload 系 列 操作 int 变 量 、lload 系 列 操作 
long 变 量 、xaload 操 作 数 组 。 本 节 实 现 其 中 的 25 
条 ， 数 组 和 xaload 系 列 指令 将 在 第 8 章 讨 论 。 下 面 以 
iload 系 列 为 例 介 绍 加 载 指令 。 





在 ch05\instructions\loads 目 录 下 创建 iload.go 文 
件 ， 在 其 中 定义 5 条 指令 ， 代 码 如 下 : 


package loads 

import "jvmgo/chOo5/instructions/base" 
import "jvmgo/cho5/rtda" 

// Load int from local variable 


type ILOAD struct{ base.Index8Instruction } 

type ILOAD 0 struct{ base.NoOperandsInstruction 
type ILOAD 1 struct{ base.NoOperandsInstruction 
type ILOAD 2 struct{ base.NoOperandsInstruction 
type ILOAD 3 struct{ base.NoOperandsInstruction 


I 





为 了 避免 重复 代码 ， 定 义 一 个 函数 供 iload 系 列 
指令 使 用 ， 人 代码 如 下 : 





func _iload(frame *rtda.Frame, index uint) { 
val := frame.LocalVars().GetIint(index) 
frame.OperandSstack().PushInt(val) 








iload 指 令 的 索引 来 自 操 作 数 ， 其 Execute () 方 
法 如 下 : 





func (self *ILOAD) Execute 人 (frame *rtda.Frame) { 
_iload(frame, uint(self.Index)) 


; 





其 余 4 条 指令 的 索引 隐 含 在 操作 人 码 中 ， 
iload 1 为 例 ， 其 Execute 〈) 方法 如 下 : 





func (self *ILOAD 1) Execute(frame *rtda.Frame) { 
_iload(frame, 1) 


二 一 


5.5 存储 指令 


和 加 载 指 令 刚 好 相反 ， 存 储 指令 把 变量 从 操作 
数 栈 顶 弹出 ， 然 后 存 入 局 部 变量 表 。 和 加 载 指令 一 
样 ， 存 储 指 令 也 可 以 分 为 6 类 。 以 lstore 系 列 指令 为 
例 进 行 介绍 。 在 ch05Ninstructions\stores 目 录 下 创建 
lstore.go 文 件 ， 在 其 中 定义 5 条 指令 ， 代 人 码 如 下 : 





package stores 

import "jvmgo/chOo5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Store long into local variable 

type LSTORE struct{ base.Index8Instruction } 
type LSTORE_ 0 struct{ base.NoOperandsInstruction 
type LSTORE_1 struct{ base.NoOperandsInstruction 
type LSTORE_ 2 struct{ base.NoOperandsInstruction 
type LSTORE_3 struct{ base.NoOperandsInstruction 


HI 





同样 定义 一 个 函数 供 5 条 指令 使 用 ， 代 码 如 
下 : 





func _lstore(frame *rtda.Frame, index uint) { 


val := frame.OperandStack().PopLong() 
frame.LocalVars().SetLong(index, val) 








lstore 指 令 的 索引 来 和 目 操 作 数 ， 其 Execute () 
方法 如 下 : 





func (self *LSTORE) Execute(frame *rtda.Frame) { 
_lstore(frame, uint(self.Index)) 


} 





其 余 4 条 指令 的 索引 隐 舍 在 操作 人 码 中 ， 以 
lstore 2 为 例 ， 其 Execute () 方法 如 下 : 





func (self *LSTORE_ 2) Execute(frame *rtda.Frame) { 
_lstore(frame, 2) 


上 





5.6 ” 栈 指 令 


栈 指 令 直 接 对 操作 数 栈 进行 操作 ， 共 9 条 : pop 
和 pop2 指 令 将 栈 顶 变量 弹出 ，dup 系 列 指令 复制 栈 
顶 变 量 ，swap 指 令 交 换 栈 顶 的 两 个 变量 。 





和 其 他 类 型 的 指令 不 同 ， 栈 指令 并 不 关心 变量 
类 型 。 为 了 实现 栈 指令 ， 需 要 给 OperandStack 结 构 
体 添加 两 个 方法 。 打 开 ch05\rtda\operand_stack.go 文 
件 ， 在 其 中 定义 PushSlot 〈) 和 PopSlot 〈) 方法 ， 
代码 如 下 : 


func (self *OperandStack) PushSlot(slot Slot) { 
self.slots[self.sizel] = slot 
self.sizett+ 


func (self *OperandSstack) PopSlot() Slot { 
self.size-- 
return self.slots[self.sizel] 


} 


5.6.1 pop 和 pop2 指 令 


在 ch05\instructions\stack 有 目录 下 创建 pop.go 文 
件 ， 在 其 中 定义 pop 和 pop2 指 令 ， 代 码 如 下 : 


package stack 

import "jvmgo/chOo5/instructions/base" 

import "jvmgo/cho5/rtda" 

type POP struct{ base.NoOperandsInstruction } 
type POP2 struct{ base.NoOperandsInstruction } 


pop 指 令 把 栈 顶 变量 弹出 ， 代 码 如 下 : 


func (self *POP) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
stack.PopSlot() 

} 


pop 指 令 只 能 用 于 弹出 int、float 等 占用 一 个 操 
作 数 栈 位 置 的 变量 。double 和 ]ong 变 量 在 操作 数 栈 
中 占据 两 个 位 置 ， 需 要 使 用 pop2 指 令 弹 出 ， 代 码 如 





func (self *POP2) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
stack.PopSlot() 
stack.PopSlot() 


,02 


dup 指 令 


在 ch05\instructions\stack 目 录 下 创建 dup.go 文 
件 ， 在 其 中 定义 6 条 指令 ， 代 人 码 如 下 : 





package stack 
import "jvmgo/chOo5/instructions/base" 
import "jvmgo/cho5/rtda" 


type 
type 
type 
type 
type 
type 


DUP struct{ base.NoOperandsInstruction } 
DUP_X1 struct{ base.NoOperandsInstruction } 
DUP_X2 struct{ base.NoOperandsInstruction } 
DUP2 struct{ base.NoOperandsInstruction } 
DUP2_ Xx1 struct{ base.NoOperandsInstruction } 
DUP2_X2 struct{ base.NoOperandsInstruction } 





dup 指 令 复制 栈 顶 的 单个 变量 ， 代 码 如 下 : 





func 


(self *DUP) Execute(frame *rtda.Frame) { 


stack := frame.OperandStack() 
slot := stack.PopSlot() 
stack.PushSlot(slot) 
stack.PushSlot(slot) 











其 他 5 条 指令 和 dup 指 令 还 是 有 一 定 差 别 的 ， 这 


里 融 不 具体 介绍 了 ， 请 读者 阅读 随 书 源 代码 。 


5.6.3 swap 指令 


在 ch05\instructions\stack 目 录 下 创建 swap.go 文 
件 ， 在 其 中 定义 swap 指 令 ， 代 码 如 下 : 





package stack 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Swap the top two operand stack values 

type SWAP struct{ base.NoOperandsInstruction } 





swap 指 令 交 换 栈 顶 的 两 个 变量 ，Execute () 


方法 如 下 : 





func (self *SWAP) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
slot1 := stack.PopSlot() 
slot2 := stack.PopSlot() 
stack.PushSlot(slot1) 
stack.PushSlot(slot2) 


5.7 ”数学 指令 


数学 指令 大 致 对 应 Java 语 言 中 的 加 、 减 、 乘 、 
除 等 数学 运算 从 。 数 学 指令 包括 算术 指令 、 位 移 指 


令 和 布尔 运算 指令 等 ， 共 37 条 ， 将 全 部 在 本 节 实 








5.7.1 算术 指令 


算术 指令 又 可 以 进一步 分 为 加 法 (add) 指 
令 、 减 法 (sub) 指令 、 乘 法 (mul) 指令 、 除 法 
Cdiv) 指令 、 求 余 (rem) 指令 和 取 反 (neg) 指令 
6 种 。 加 、 减 、 乘 、 除 和 取 反 指令 都 比较 简单 ， 本 
节 以 稍微 复杂 一 些 的 求 余 指令 为 例 进行 讨论 。 


在 ch05Ninstructions\math 目录 下 创建 rem.go 文 
件 ， 在 其 中 定义 4 条 求 余 指令 ， 代 码 如 下 : 





package math 

import "math" 

import "jvmgo/chOo5/instructions/base" 

import "jvmgo/cho5/rtda" 

type DREM struct{ base.NoOperandsInstruction 
type FREM struct{ base.NoOperandsInstruction 
type IREM struct{ base.NoOperandsInstruction 
type LREM struct{ base.NoOperandsInstruction 


HI 





irem 和 ]lrem 代 码 差 不 多 ， 以 irem 为 例 ， 其 


Execute () 方法 如 下 : 





func (self *IREM) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
if v2 == © { 
panic("java.lang.ArithmeticException: / by zero") 


result := v1 % v2 
stack.PushIint(result) 





先 从 操作 数 栈 中 弹出 两 个 int 变 量 ， 求 余 ， 然 后 
把 结果 推 入 操作 数 栈 。 这 里 注意 一 点 ， 对 int 或 long 
变量 做 除法 和 求 余 运 算 时 ， 是 有 可 能 抛 出 
ArithmeticException 异 常 的 。frem 和 drem 指 令 差 不 


多 ， 以 drem 为 例 ， 其 Execute () 方法 如 下 : 





func (self *DREM) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
V2 := stack.PopDouble() 
v1 := stack.PopDouble() 
result := math.Mod(vi, v2) 
stack.PushDouble(result) 

+ 


[EE | 


Go 语言 没有 给 浮 点 数 关 型 定义 求 余 操 作 符 ， 所 
以 需要 使 用 math 包 的 Mod〈) 函数 。 另 外 ， 浮 点 数 
类 型 央 为 有 Infinity (无 穷 大 ) 值 ， 所 以 即使 是 除 


零 ， 也 不 会 导致 ArithmeticException 异 常 抛 出 。 


5.7.2 ”位 移 指令 


位 移 指令 可 以 分 为 正 移 和 右 移 两 种 ， 右 移 指令 
又 可 以 分 为 算术 右 移 《有 符号 右 移 ) 和 人 逻辑 右 移 
〈 无 符号 右 移 ) 两 种 。 算 术 右 移 和 逻辑 位 移 的 区 别 
仪 在 于 符 写 位 的 扩展 ， 如 下 面 的 Java 代 人 码 所 示 。 





int x = -1; 

println(Integer.toBinaryString(x)); // 11111111111111111 
printin(Integer.toBinaryString(x >> 8)); // 11111111111111111 
println(Integer .toBinaryString(x >>> 8)); // 00000000111111111 





在 ch05\instructions\math 目 录 下 创建 sh.go 文 
件 ， 在 其 中 定义 6 条 位 移 指令 ， 代 人 码 如 下 : 





package math 

import "jvmgo/chOo5/instructions/base" 

import "jvmgo/cho5/rtda" 

type ISHL struct{ base.NoOperandsInstruction } // int 左 位 移 


type ISHR struct{ base.NoOperandsInstruction } // int 算 术 右 


type IUSHR struct{ base.NoOperandsInstruction } // int 这 辑 右 


type LSHL struct{ base.NoOperandsInstruction } // long 左 位 移 


type LSHR struct{ base.NoOperandsInstruction } // long 算 术 右 


type LUSHR struct{ base.NoOperandsInstruction } // long 允 辑 z 





左 移 指 令 比 较 简 单 ， 以 ishl 指 令 为 例 ， 其 
Execute () 方法 如 下 : 





func (self *ISHL) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
Ss := Uint32(v2) & Ox1f 
result := v1 << S 
stack.PushIint(result) 





先 从 操作 数 栈 中 弹出 两 个 int 变 量 vV2 和 v1。v1 古 
要 进行 位 移 操作 的 变量 ，v2 指 出 要 移 位 多 少 比特 。 


位 移 之 后 ， 把 结果 推 入 操作 数 栈 。 这 里 注意 两 点 : 
第 一 ，int 变 量 只 有 32 位 ， 所 以 只 取 v2 的 前 5 个 比特 
就 足够 表示 位 移 位 数 了 ; 第 二 ，Go 语 言 位 移 操 作 符 
右 侧 必须 是 无 符号 整数 ， 所 以 需要 对 v2 进行 类 型 转 
换 。 





算术 右 移 指令 需要 扩展 符号 位 ， 代 人 码 和 左 移 指 
令 基 本 上 差不多 。 以 lshr 指 令 为 例 ， 其 Execute () 
方法 如 下 : 


func (self *LSHR) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopLong() 
S := Uint32(v2) & Ox3f 
result := v1 >> S 
stack.PushLong(result) 


后 以 iushr 为 例 ， 介 绍 馆 辑 右 移 指令 是 如 何 实现 的 。 





func (self *IUSHR) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
Ss := Uint32(v2) & Ox1f 
result := int32(uint32(v1i) >> s) 
stack.PushIint(result) 





Go 语言 并 没有 Java 语 言 中 的 >>> 运 算 符 ， 为 了 
达到 无 符 写 位 移 的 目的 ， 需 要 先 把 v1 转 成 无 从 号 整 
数 ， 位 移 操 作 之 后 ， 再 转 回 有 符号 整数 。 











5.7.3 ”布尔 运算 指令 


布尔 运算 指令 只 能 操作 int 和 long 变 量 ， 分 为 投 
位 与 (and) 、 按 位 或 (or) 、 按 位 异 或 (xor) 3 
种 。 以 按 位 与 为 例 介 绍 布尔 运算 指令 。 在 
ch05\instructions\math 目 录 下 创建 and.go 文 件 ， 在 其 
中 定义 iand 和 land 指 令 ， 代 码 如 下 : 





package math 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/cho5/rtda" 

type IAND struct{ base.NoOperandsInstruction } 
type LAND struct{ base.NoOperandsInstruction } 





以 iand 指 令 为 例 ， 其 Execute () 方法 如 下 : 





func (self *IAND) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
result := v1 & v2 
stack.PushIint(result) 
上 


ee | 


代码 比较 简单 ， 就 不 多 解释 了 。 


5.7.4 iinc 指 令 





iinc 指 令 给 局 部 变量 表 中 的 int 变 量 增加 常量 
值 ， 局 部 变量 表 索 引 和 第 量 值 都 由 指令 的 操作 数 提 
供 。 在 ch05\instructions\math 目录 下 创建 iinc.go 文 
件 ， 在 其 中 定义 iinc 指 令 ， 代 码 如 下 : 














package math 
import "jvmgo/chOo5/instructions/base" 
import "jvmgo/cho5/rtda" 
// Increment local variable by constant 
type IINC struct { 

Index uint 

Const int32 











FetchOperands〈) 函数 从 字 节 码 里 该 取 操 作 
数 ， 代 人 码 如 下 : 





func (self *IINC) Fetchoperands(reader *base.BytecodeReader) { 
self.Index = uint(reader.ReadUint8()) 
self.Const = int32(reader.ReadInt8()) 
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Execute 〈) 方法 从 局 部 变量 表 中 读 取 变量 ， 给 
它 加 上 常量 值 ， 再 把 结果 写 回 局 部 变量 表 ， 代 人 码 如 
下 : 














func (self *IINC) Execute(frame *rtda.Frame) { 
localVars := frame.LocalVars() 
val := localVars.GetInt(self.Index) 
val += self.Const 
localVars.SetIint(self.Index, val) 

} 


A 


5.8 ”类 型 转换 指令 








类 型 转换 指令 大 致 对 应 Java 语 言 中 的 基本 类 型 
强制 转换 操作 。 类 型 转换 指令 有 共 15 条 ， 将 全 部 在 
本 节 实 现 。 引 用 类 型 转换 对 应 的 是 checkcast 指 令 ， 


将 在 第 6 章 介 绍 。 





按照 被 转换 变量 的 类 型 ， 类 型 转换 指令 可 以 分 
为 3 种 :i2x 系 列 指令 把 int 变 量 强制 转换 成 其 他 类 
型 ，12x 系 列 指 令 把 long 变 量 强制 转换 成 其 他 类 型 ; 
f2x 系 列 指令 把 float 变 量 强 制 转换 成 其 他 类 型 ，d2x 
系列 指令 把 double 弯 量 强制 转换 成 其 他 类 型 。 以 d2x 
系列 指令 为 例 进 行 讨论 。 


在 ch05\instructions\conversions 目 录 下 创建 
d2x.go 文 件 ， 在 其 中 定义 d2f、d2i 和 d21 指 令 ， 代 码 


uh ks 





package conversions 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/chos5/rtda" 

type D2F struct{ base.NoOperandsInstruction } 
type D2I struct{ base.NoOperandsInstruction } 
type D2L struct{ base.NoOperandsInstruction } 





以 d2i 指 令 为 例 ， 它 的 Execute () 方法 如 下 : 





func (self *D2I) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
d := stack.PopDouble() 
i := int32(d) 
stack.PushIint(i) 
} 





因为 Go 语言 可 以 很 方便 地 转换 各 种 基本 类 型 的 
变量 ， 所 以 类 型 转换 指令 实现 起 来 还 是 比较 容易 
的 。 


5.9 ”比较 指令 


比较 指令 可 以 分 为 两 类 : 一 类 将 比较 结果 推 入 
操作 数 栈 项 ， 一 类 根据 比较 结果 跳 转 。 比 较 指令 是 
编译 器 实现 if-else、for、while 等 语句 的 基石 ， 共 有 


19 条 ， 将 全 部 在 本 节 实 现 。 





5.9.1 lcmp 指 令 


lcmp 指 令 用 于 比较 long 变 量 。 在 
chO5S\instructions\comparisons 目 录 下 创建 lemp.go 文 
件 ， 在 其 中 定义 lemp 指 令 ， 代 码 如 下 : 





package comparisons 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Compare long 

type LCMP struct{ base.NoOperandsInstruction } 





Execute〈) 方法 把 栈 顶 的 两 个 long 变 量 弹 出 ， 
进行 比较 ， 然 后 把 比较 结果 “(int 型 0、1 或 -1) 推 入 





func (self *LCMP) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopLong() 
v1 := stack.PopLong() 
if vi > v2 { 
stack.PushIint(1) 
} else if vi == v2 { 
stack.PushIint(0) 


} else { 
stack.PushIint(-1) 
} 


上 
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5.9.2 fcmp<op> 和 dcmp<op> 指 令 


fcmpg 和 fcmpl 指 令 用 于 比较 float 变 量 。 在 
chOS\instructions\comparisons 日 录 下 创建 femp.go 文 
件 ， 在 其 中 定义 fempg 和 fcmpl 指 令 ， 代 人 码 如 下 : 


package comparisons 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Compare float 

type FCMPG struct{ base.NoOperandsInstruction } 
type FCMPL struct{ base.NoOperandsInstruction } 


这 两 条 指令 和 lcmp 指 令 很 像 ， 但 是 除了 比较 的 
变量 类 型 不 同 以 外 ， 还 有 一 个 重要 的 区 别 。 由 于 浮 
点 数 计 算 有 可 能 产生 NaN (Nota Number) 值 ， 所 
以 比较 两 个 浮 点 数 时 ， 除 了 大 于 、 等 于 、 小 于 之 
外 ， 还 有 第 4 种 结果 : 无 法 比较 。fcmpg 和 fcmpl 指 
令 的 区 别 就 在 于 对 第 4 种 结果 的 定义 。 编 写 一 个 函 








数 来 统一 比较 float 变 量 ， 人 代码 如 下 : 





func _fcmp(frame *rtda.Frame, gFlag bool) { 
stack := frame.OperandStack() 
v2 := stack.PopFloat() 
v1 := stack.PopFloat() 
if vi > v2 { 
stack.PushIint(1) 
else if v1 == v2 { 
stack.PushIint(0) 
else if vi < v2 
stack.PushInt(-1) 
else if gFlag { 
stack.PushIint(1) 
else { 
stack.PushInt(-1) 


vo cm cm cc 





fcmpg 和 fcmpl 指 令 的 Execute 〈) 方法 只 是 简单 
地 调用 _fcmp《〈) 函数 而 已 ， 代 码 如 下 : 





func (self *FCMPG) Execute 人 (frame *rtda.Frame) { 
_fcmp(frame, true) 


func (self *FCMPL) Execute(frame *rtda.Frame) { 
_fcmp(frame, false) 


. 





也 就 是 说 ， 当 两 个 float 变 量 中 至 少 有 一 个 是 





NaN 时 ， 用 fcmpg 指 令 比 较 的 结果 是 1， 而 用 fcmpl 指 


令 比较 的 结果 是 -1。 








dcmpg 和 dcmpl 指 令 用 来 比较 double 变 量 ， 在 
dcmp.go 文 件 中 ， 这 两 条 指令 和 fcmpg、fcmpl 指 令 
除了 比较 的 变量 类 型 不 同 之 外 ， 代 码 基 本 上 完全 一 
样 ， 这 里 束 不 详细 介绍 了 。 











sh Ne 


if<cond> 指 令 


在 ch05\instructions\comparisons 目 录 下 创建 
ifcond.go 文 件 ， 在 其 中 定义 6 条 if<cond> 指 令 ， 代 码 


如 下 : 





package comparisons 
import "jvmgo/cho5/instructions/base" 
import "jvmgo/cho5/rtda" 


// Branch 


type 
type 
type 
type 
type 
type 


IFEQ 
IFNE 
IFLT 
IFLE 
IFGT 
IFGE 


if int comparison with zero succeeds 


struct{ base. 
struct{ base. 
struct{ base. 
struct{ base. 
struct{ base. 
struct{ base. 


BranchInstruction 
BranchInstruction 
BranchInstruction 
BranchInstruction 
BranchInstruction 
BranchInstruction 


上 


} 
} 
和 
3 
上 





if<cond> 指 令 把 操作 数 栈 顶 的 int 变 量 弹出 ， 然 
后 跟 0 进行 比较 ， 满 足 条 件 则 跳 转 。 假 设 从 栈 顶 弹 
出 的 变量 是 zx， 则 指令 执行 跳 转 操作 的 条 件 如 下 : 


ifeq: x==0 


.iftne: x! =0 

* 1flt: x<0 

* ifle: x<=0 

* ifgt: x>0 

“ ifge: x>=0 
以 ifeq 指 令 为 例 ， 其 Execute () 方法 如 下 : 


func (self *IFEQ) Execute(frame *rtda.Frame) { 
val := frame.OperandStack().PopInt() 
if val == © { 
base.Branch(frame, self.offset) 
+ 
+ 


真正 的 跳 转 逻辑 在 Branch () 函数 中 。 因 为 这 
个 函数 在 很 多 指令 中 都 会 用 到 ， 所 以 把 它 定 义 在 
ch0O5\instructions\base\branch_logic.go 文 件 中 ， 代 码 








如 下 : 





package base 

import "jvmgo/cho5/rtda" 

func Branch(frame *rtda.Frame, offset int) { 
pc := frame.Thread().PC() 
nextPC := pc + offset 
frame.SetNextPC(nextPC) 


} 





Frame 结 构 体 的 SetNextPC() 方法 将 在 5.12 小 


节 介 绍 。 


5.9.4 if icmp<cond> 指 令 


在 ch05Ninstructions\comparisons 目 录 下 创建 
if_icmp.go 文 件 ， 在 其 中 定义 6 条 if_icmp 指 令 ， 代 码 
如 下 : 





package comparisons 

import "jvmgo/chOo5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Branch if int comparison succeeds 

type IF_ICMPEQ struct{ base.BranchInstruction 
type IF_ICMPNE struct{ base.BranchInstruction 
type IF_ICMPLT struct{ base.BranchInstruction 
type IF_ICMPLE struct{ base.BranchInstruction 
type IF_ICMPGT struct{ base.BranchInstruction 
type IF_ICMPGE struct{ base.BranchInstruction 


I 





if_ icmp<cond> 指 令 把 栈 顶 的 两 个 int 变 量 弹 出 ， 
然后 进行 比较 ， 满 足 条 件 则 跳 转 。 跳 转 条 件 和 
if<cond> 指 令 类 似 。 以 证 icmpne 指 令 为 例 ， 其 


Execute () 方法 如 下 : 





func (self *IF_ICMPNE) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
val2 := stack.PopInt() 
val1i := stack.PopInt() 
if vali != val2 { 
base.Branch(frame, self.offset) 


了 


5.9.5 证 acmp<cond> 指 令 


在 ch05Ninstructions\comparisons 目 录 下 创建 
if_acmp.go 文 件 ， 在 其 中 定义 两 条 if_acmp<cond> 指 





package comparisons 

import "jvmgo/chOo5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Branch if reference comparison succeeds 

type IF_ACMPEQ struct{ base.BranchInstruction } 
type IF_ACMPNE struct{ base.BranchInstruction } 








if_acmpeq 和 if_acmpne 指 令 把 栈 顶 的 两 个 引用 
弹出 ， 根 据 引 用 是 否 相 同 进行 跳 转 。 以 if_acmpeq 指 
邻 为 例 ， 其 Execute () 方法 如 下 : 








func (self *IF_ACMPEQ) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
ref2 := Stack.PopRef() 
ref1 := stack.PopRef() 
if ref1 == ref2 { 
base.Branch(frame, self.offset) 


} 


5.10 控制 指令 


控制 指令 共有 11 条 。jsr 和 ret 指 令 在 Java 6 之 前 
用 于 实现 finally 子 名 ， 从 Java 6 开始 ，Oracle 的 Java 
编译 右 已 经 不 再 使 用 这 两 条 指令 了 ， 本 书 不 讨论 这 
两 条 指令 。retum 系 列 指令 有 6 条 ， 用 于 从 方法 调用 
中 人 返回， 将 在 第 7 草 讨论 方法 调用 和 返回 时 实现 这 6 
条 指令 。 本 市 实现 剩 下 的 3 条 指令 : goto、 


tableswitch 和 1lookupswitch 。 











5.10.1 goto 指令 


在 ch05\instructions\control 目 录 下 创建 goto.go 文 
件 ， 在 其 中 定义 goto 指 令 ， 代 码 如 下 : 





package control 

import "jvmgo/chOo5/instructions/base" 
import "jvmgo/cho5/rtda" 

// Branch always 

type GOTO struct{ base.BranchIinstruction } 





goto 指 令 进 行 无 条 件 跳 转 ， 其 Execute() 方法 
如 下 : 





func (self *GOTO) Execute(frame *rtda.Frame) { 
base.Branch(frame, self.offset) 


} 





5.10.2 tableswitch 指 令 


Java 语 言 中 的 switch-case 语 句 有 两 种 实现 方 
式 : 如 果 case 值 可 以 编码 成 一 个 索引 表 ， 则 实现 成 
tableswitch 指 令 ; 否则 实现 成 lookupswitch 指 令 。 
Java 虚 拟 机 规范 的 3.10 小 节 里 有 两 个 例子 ， 我 们 可 
以 借用 一 下 。 下 面 这 个 Java 方 法 中 的 switch-case 可 
以 编译 成 tableswitch 指 令 ， 代 码 如 下 : 


int chooseNear(int i) { 
switch (i) { 
case 0: return 
case 1: return 
case 2: return 
default: return - 
} 
} 


POPO 


下 面 这 个 Java 方 法 中 的 Switch-case 则 需要 编译 
成 lookupswitch 指 令 


int chooseFar(int i) { 
switch (i) { 
case -100: return -1; 


case 0: return 0; 
case 100: return 1; 
default: return -1; 





在 ch05\instructions\control 目 录 下 创建 
tableswitch.go 文 件 ， 在 其 中 定义 tableswitch 指 令 ， 
代码 如 下 : 





package control 

import "jvmgo/chOo5/instructions/base" 
import "jvmgo/cho5/rtda" 

// Access jump table by index and jump 
type TABLE SWITCH struct { 


defaultoffset int32 
low int32 
high int32 
Jumpoffsets []int32 


} 





tableswitch 指 令 的 操作 数 比 较 复 林 ， 它 的 


FetchOperands () 方法 如 下 : 





func (self *TABLE SWITCH) Fetchoperands(reader *base.BytecodeR 
reader .SkipPadding() 


self.defaultOoffset = reader,ReadInt32() 

self.low = reader.ReadInt32() 

self.high = reader .ReadInt32() 

jumpOoffsetsCount := self.high - self.low + 1 
self.jumpOoffsets = reader ,ReadInt32S(jumpoffsetsCount ) 


tableswitch 指 令 操 作 码 的 后 面 有 0~3 字 节 的 
padding， 以 保证 defaultOffset 在 字 节 码 中 的 地 址 是 4 
的 倍数 。BytecodeReader 结 构 体 的 SkipPadding () 
方法 如 下 : 


func (self *BytecodeReader) SkipPadding() { 
for self.pc%4 != © { 
self.ReadUint8() 
} 
} 


defaultOffset 对 应 默认 情况 下 执行 跳 转 所 需 的 
字 节 码 偏 移 量 ;，low 和 high 记 录 case 的 取 值 范围 ; 
jumpOffsets 是 一 个 索引 表 ， 里 面 存放 high-low+1 个 
int 值 ， 对 应 各 种 case 悄 况 下 ， 执 行 跳 转 所 需 的 字 节 
码 偏 移 量 。BytecodeReader 结 构 体 的 ReadInt32s () 





方法 如 下 : 





func (self *BytecodeReader) ReadInt32s(n int32) []int32 { 
ints := make([]int32, n) 
for i := range ints { 
ints[i] = self.ReadInt32() 


return ints 





Execute() 方法 先 从 操作 数 栈 中 弹出 一 个 int 
变量 ， 然 后 看 它 是 否 在 low 和 high 给 定 的 范围 之 内 。 
如 果 在 ， 则 从 jumpOffsets 表 中 查 出 偏 移 量 进行 跳 
转 ， 否 则 按照 defaultOffset 跳 转 。 代 码 如 下 : 








func (self *TABLE_ SWITCH) Execute(frame *rtda.Frame) { 
index := frame.OperandStack().PopInt() 
var offset int 
If index >= self.low && index <= self.high { 
offset = int(self.jumpoffsets[index-self.1low]) 
} else { 
offset = int(self.defaultoffset) 


base.Branch(frame, offset) 
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5.10.3 lookupswitch 指 令 


在 ch05\instructions\control 目 录 下 创建 
lookupswitch.go 文 件 ， 在 其 中 定义 lookupswitch 指 





package control 

import "jvmgo/cho5/instructions/base" 
import "jvmgo/cho5/rtda" 

type LOOKUP_SWITCH Struct { 


defaultoffset int32 
npairs int32 
matchoffsets []int32 





FetchOperands 〈) 方法 也 要 先 跳 过 padding,， 
代码 如 下 : 





func (self *LOOKUP_SWITCH) Fetchoperands (reader *base.Bytecode 
reader ,SkipPadding( ) 
self.defaultoffset = reader.ReadInt32() 
self.npairs = reader.ReadInt32() 
self.matchoffsets = reader.ReadIint32s(self.npairs * 2) 


matchOffsets 有 点 像 Map， 它 的 key 是 case 值 ， 
value 是 跳 转 偏 移 量 。Execute() 方法 先 从 操作 数 
栈 中 弹出 一 个 int 变 量 ， 然 后 用 它 查 找 
matchOffsets， 看 是 任 能 找到 匹配 的 key。 如 下 能 ， 
则 按照 value 给 出 的 偏 移 量 跳 转 ， 人 奋 则 按照 


defaultOffset 跳 转 。 代 人 码 如 下 : 





func (self *LOOKUP_SWITCH) Execute(frame *rtda.Frame) { 
key := frame.OperandStack().PopInt() 
for i := int32(0); i < self.npairs*2; i += 2 1{ 
if self.matchoffsets[i] == key { 
offset := self.matchoffsets[i+1] 
base.Branch(frame, int(offset)) 
return 


} 


base.Branch(frame, int(self.defaultoffset)) 
} 


二 一 


5.11 扩展 指令 


扩展 指令 共有 6 条 。 和 jsr 指 令 一 样 ， 本 书 不 讨 
论 jsr_w 指 令 。multianewarray 指 令 用 于 创建 多 维 数 
组 ， 在 第 8 间 讨 论 数 组 时 实现 该 指令 。 本 市 实现 和 镜 


下 的 4 条 指令 。 


5.11.1 wide 指令 


加 载 类 指令 、 存 储 类 指令 、ret 指 令 和 iinc 指 令 
需要 按 索 引 访 问 局 部 变量 表 ， 索 引 以 uint8 的 形式 存 
在 字 节 人 码 中 。 对 于 大 部 分 方法 来 说 ， 局 部 变量 表 大 
小 都 不 会 超过 256， 所 以 用 一 字 节 来 表示 索引 就 够 
了 。 但 是 如 果 有 方法 的 局 部 变量 表 超 过 这 限制 呢 ? 
Java 虚 拟 机 规范 定义 了 wide 指令 来 扩展 前 述 指令 。 

















在 ch05\instructions\extended 目 录 下 创建 wide.go 





package extended 
import "jvmgo/cho5/instructions/base" 
import "jvmgo/cho5/instructions/loads" 
import "jvmgo/cho5/instructions/math" 
import "jvmgo/cho5/instructions/stores" 
import "jvmgo/cho5/rtda" 
// Extend local variable index by additional bytes 
type WIDE struct { 
modifiedInstruction base.Instruction 


} 


wide 指令 改变 其 他 指令 的 行为 ， 
modifiedInstruction 字 段 存放 被 改变 的 指令 。wide 指 
令 需 要 目 己 解码 出 modifiedInstruction ， 


FetchOperands 〈) 方法 的 代码 如 下 : 





func (self *WIDE) Fetchoperands(reader *base.BytecodeReader) { 


opcode := reader.ReadUint8() 
switch opcode { 

case Ox15: ... // iload 
case QOx16: ... // lload 
case QOx17: ... // fload 
case Ox18: ... // dload 
case Ox19: ... // aload 
case Ox36: ... // istore 
case Ox37: ... // lstore 
case QOx38: ... // fstore 
case Ox39: ... // dstore 
case Ox3a: ... // astore 


case QOx84: ... // iinc 
case QOxa9: // ret 
panic("Unsupported opcode: Oxa9!") 
} 
} 








FetchOperands () 方法 先 从 字 市 码 中 读 取 一 字 
节 的 操作 人 码 ， 然 后 创建 子 指令 实例 ， 最 后 读 取 子 指 
令 的 操作 数 。 因 为 没有 实现 ret 指 令 ， 所 以 暂时 调用 


panic《〈) 函数 终止 程序 执行 。 加 载 指令 和 存储 指令 
都 只 有 一 个 操作 数 ， 需 要 扩展 成 2 字 节 ， 以 iload 为 
例 : 





case 0X15 : 
inst := &loads.ILOAD{} 
inst.Index = uint(reader.ReadUint16()) 
self .modifiedIinstruction = inst 





iinc 指 令 有 两 个 操作 数 ， 都 需要 扩展 成 2? 字 节 ， 
代码 如 下 : 





case QOx84: 
inst := &math.IINC{} 
inst.Index = uint(reader.ReadUint16()) 
inst.Const = int32(reader.ReadInt16()) 
self .modifiedInstruction = inst 








wide 指令 只 是 增加 了 索引 宽度 ， 并 不 改变 子 指 
令 操 作 ， 所 以 其 Execute () 方法 只 要 调用 子 指令 的 
Execute 〈) 方法 即 可 ， 代 码 如 下 : 





func (self *WIDE) Execute(frame *rtda.Frame) { 
self .modifiedIinstruction.Execute(frame) 


二 一 


5.11.2 ifnul 和 ifnonnull 指 令 


在 ch05Ninstructions\extended 目 录 下 创建 inull.go 
文件 ， 在 其 中 定义 ifnull 和 ifnonnull 指 令 ， 代 人 码 如 
下 : 





package extended 

import "jvmgo/chOo5/instructions/base" 

import "jvmgo/cho5/rtda" 

type IFNULL struct{ base.BranchInstruction } // Branch if refe 
type IFNONNULL struct{ base.BranchInstruction } // Branch if r 








根据 引用 是 否 是 null 进 行 跳 转 ，ifnull 和 
ifnonnull 指 令 把 栈 顶 的 引用 弹出 。 以 ifnull 指 令 为 
例 ， 它 的 Execute () 方法 如 下 : 





func (self *IFNULL) Execute(frame *rtda.Frame) { 
ref := frame.OperandStack( ).PopRef() 
if ref == nil { 
base.Branch(frame, self.offset) 
} 
} 


ee | 


5.11.3 goto_w 指 令 


在 ch05\instructions\extended 目 录 下 创建 
goto_w.go 文 件 ， 在 其 中 定义 goto_w 指 令 ， 代 人 码 如 
下 : 





package extended 
import "jvmgo/chOo5/instructions/base" 
import "jvmgo/cho5/rtda" 
// Branch always (wide index) 
type GOTO W struct { 
offset int 





goto_w 指 令 和 goto 指 令 的 唯一 区 别 束 是 索引 从 
2 字 节 变 成 了 4 字 节 。FetchOperands 〈) 方法 代码 如 
下 : 





func (self *GOTO_W) FetchOperands(reader *base.BytecodeReader) 
self.offset = int(reader.ReadInt32()) 
} 





Execute 〈) 方法 的 代码 如 下 : 





func (self *GOTO W) Execute(frame *rtda.Frame) { 
base.Branch(frame, self.offset) 


} 





5.12 解释 需 





日 令 集 已 经 实现 得 差不多 了 ， 本 和 编写 一 个 简 
单 的 解释 左 。 这 个 解释 磺 目 前 只 能 执行 一 个 Java 方 
法 ， 但 是 在 后 面 的 章节 中 ， 会 不 断 完 善 它 ， 让 和 它 变 
得 越 来 越 强 大 。 在 ch05 目 录 下 创建 interpreter.go 文 

件 ， 在 其 中 定义 interpret () 函数 ， 代 码 如 下 : 





package main 

import "fmt" 

import "jvmgo/cho5/classfile" 

import "jvmgo/chOo5/instructions" 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/cho5/rtda" 

func interpret(methodInfo *classfile.MemberInfo) {...} 


interpret〈) 方法 的 参数 是 MemberInfo 指 针 ， 
调用 MemberInfo 结 构 体 的 CodeAttribute () 方法 可 
以 获取 它 的 Code 属 性 ， 语 法 结构 如 下 : 





func interpret(methodInfo *classfile.MemberInfo) { 
codeAttr := methodInfo,CodeAttribute() 
，// 其 他 代码 





CodeAttribute 〈) 方法 是 新 增加 的 ， 代 码 在 
ch05\classfilemember_info.go 文 件 中 ， 代 人 码 如 下 : 





func (self *MemberInfo) CodeAttribute() *CodeAttribute { 

for _, attrIinfo := range self.attributes { 

Switch attrInfo,(type) { 

case *CodeAttribute: 

return attrIinfo.(*CodeAttribute) 

} 
} 
return nil 


} 





得 到 Code 属 性 之 后 ， 可 以 进一步 获得 执行 方法 
所 需 的 局 部 变量 表 和 操作 数 栈 空间 ， 以 及 方法 的 字 


让 个 。 





func interpret(methodInfo *classfile.MemberInfo) { 
codeAttr := methodIinfo.CodeAttribute() 
maxLocals := codeAttr.MaxLocals() 
maxStack := codeAttr.MaxStack() 


bytecode := codeAttr.Code() 
，// 其 他 代码 





interpret〈 ) 方法 的 其 余 代 码 移 创建 一 个 Thread 
实例 ， 然 后 创建 一 个 帧 并 把 它 推 入 Java 虚 拟 机 栈 
顶 ， 最 后 执行 方法 。 完 整 的 代码 如 下 : 





func interpret(methodInfo *classfile.MemberInfo) { 
codeAttr := methodIinfo.CodeAttribute() 
maxLocals := codeAttr.MaxLocals() 
maxStack := codeAttr.MaxStack() 
bytecode := codeAttr.Ccode() 
thread := rtda.NewThread ( ) 
frame := thread.NewFrame(maxLocals, maxStack) 
thread.PushFrame(frame ) 
defer catchErr(frame ) 
loop(thread, bytecode) 





Thread 结 构 体 的 NewFrame 〈) 方法 是 新 增加 
的 ， 代 码 在 ch05\rtda\thread.go 文 件 中 ， 如 下 所 示 : 





func (self *Thread) NewFrame(maxLocals, maxStack uint) *Frame 
return newFrame(self, maxLocals, maxStack) 
} 


Frame 结 构 体 也 有 变化 ， 增 加 了 两 个 字段 ， 改 
动 如 下 在 ch05\rtda\frame.go 文 件 中 ) : 





type Frame struct { 


Jower *Frame 
localVars LocalVars 
operandStack *OperandStack 
thread *Thread 
neXxtPC int 








这 两 个 字段 主要 是 为 了 实现 跳 转 指令 而 添加 
的 ， 回 顾 一 下 Branch 〈) 方法 ， 代 和 码 如 下 : 





func Branch(frame *rtda.Frame, offset int) { 
pc := frame.Thread().PC() 
nextPC := pc + offset 
frame.SetNextPC(nextPC) 

} 





Frame 结 构 体 的 newFrame () 方法 也 相应 发 生 
了 了 变化， 改动 如 下 : 





func newFrame(thread *Thread, maxLocals, maxStack uint) *Frame 


return &Framet 
thread : thread, 
localVars: newLocalVars(maxLocals), 
operandStack: newOperandSstack(maxStack), 





回 到 interpret〈) 方法 ， 我 们 的 解释 器 目前 还 
没有 办 法 优雅 地 结束 运行 。 因 为 每 个 方法 的 最 后 一 
条 指令 都 是 菏 个 retum 指 令 ， 而 还 没有 实现 return 指 
令 ， 所 以 方法 在 执行 过 程 中 必定 会 出 现 错误 ， 此 时 
解释 器 逻辑 会 转 到 catchErr () 函数 ， 代 码 如 下 : 


func catchErr(frame *rtda.Frame) { 
if r := recover(); r != nil { 
fmt.Printf("LocalVars:%v\n", frame.LocalVars()) 
fmt.Printf("OperandStack:%v\n", frame.OperandStack()) 
panic(r) 


把 局 部 变量 表 和 操作 数 栈 的 内 容 打 印 出 来 ， 
此 来 观察 方法 的 执行 结果 。 还 剩 一 个 loop () 函 
数 ， 其 代 但 如 下 : 


func loop(thread *rtda.Thread, bytecode [lbyte) { 


frame := thread.PopFrame() 
reader := &base.BytecodeReaderf{} 
for { 


pc := frame.NextPC() 

thread .SetPC(pc ) 

// decode 

reader ,Reset(bytecode，pc) 

opcode := reader,ReadUint8() 

inst := instructions.NewInstruction(opcode) 
inst.FetchOperands(reader) 
frame.SetNextPpC(reader.PC()) 

// execute 

fmt.Printf("pc:%2d inst:%T %v\n", pc, inst, inst) 
inst.Execute(frame) 





loop〈) 函数 循环 执行 “计算 pc、 解 码 指令 、 执 
行 指令 ”这 三 个 步骤 ， 直 到 遇 到 错误 ! 代码 中 有 一 
个 函数 还 没有 给 出 代码 : NewInstruction () 。 这 个 
图 数 是 switch-case 语 句 ， 根 据 操作 码 创建 具体 的 指 
令 ， 代 码 在 ch05\instructions\factory.go 文 件 中 ， 如 下 
所 示 : 








package instructions 

import "fmt" 

import "jvmgo/cho5/instructions/base" 

import . "jvmgo/chO5/instructions/comparisons" 


Import . "jvmgo/chO5/instructions/constants" 


import . "jvmgo/chO5/instructions/control" 
import . "jvmgo/chO5/instructions/conversions" 
import . "jvmgo/chO5/instructions/extended" 
import . "jvmgo/chO5/instructions/loads" 
import . "jvmgo/ch0O5/instructions/math" 

import . "jvmgo/chO5/instructions/stack" 
import "jvmgo/chO5/instructions/stores" 


func NewInstruction(opcode byte) base.Instruction { 
switch opcode { 
case 0X00: return &NOP{} 
case 0Xx01: return &ACONST_NULL{} 
default: 
panic(fmt.Errorf("Unsupported opcode: Ox%x!", opcode)) 


} 
} 





这 个 switch-case 语 句 非 常 长 ， 为 了 节约 篇 幅 ， 
这 里 就 不 给 出 全 部 代码 了 。 另 外 ， 有 很 大 一 部 分 指 
令 是 没有 操作 数 的 ， 没 有 必要 每 次 都 创建 不 同 的 实 
例 。 为 了 优化 ， 可 以 给 这 些 指令 定义 单 例 变量 ， 代 
码 如 下 : 





var ( 
nop 
aconst_null 


&NOP{} 
&ACONST_NULL{} 


对 于 这 类 指令 ， 在 NewInstruction () 函数 中 直 


接 返 回 单 例 变量 即 可 ， 代 码 如 下 : 





func NewInstruction(opcode byte) base.Instruction { 
switch opcode { 
case 0x00: return nop 
case Ox0O1: return aconst_null 


$ 


[EE | 


5.13 ”测试 本 章 代 三 





德国 大 数学 家 高 斯 有 一 个 广 为 流 传 的 小 故事 。 
话说 高 斯 7 岁 开 始 上 学 ，10 岁 开始 学 习 数 学 。 有 一 
天 ， 数 学 老师 布置 了 一 道 题 : 问 1+2+3...... 这 样 从 1 
一 直 加 到 100 等 于 多 少 。 老 师 原 以 为 孩子 们 要 算 上 
段 时 间 ， 可 是 没 想到 小 高 斯 很 快 就 给 出 了 答案 。 
高 斯 当然 不 是 从 1 一 直 加 到 100， 而 是 用 更 聪明 的 办 
法 计算 的 : 1+100=101，2+99=101......1 加 到 100 有 
50 组 这 样 的 数 ， 所 以 50*101=5050。 





本 节 用 最 条 的 办 法 来 计算 这 个 题目 ， 考 验 一 下 
虚拟 机 是 否 可 以 工作 。 随 书 Java 代 码 里 有 一 个 例 
子 ， 代 人 码 如 下 : 


package jvmgo,book ,cho5 ; 


public class GaussTest { 
public static void main(String[|] args) { 
int sum = 0， 
for (int i = 1; i <= 100; i++) { 
Sum += 工 ; 
} 


System.out.println(sum); 





下 面 改造 ch05\main.go 文 件 。 首 先 修 改 import 语 
句 ， 代 码 如 下 : 





package main 

import "fmt" 

import "strings" 

import "jvmgo/cho5/classfile" 
import "jvmgo/cho5/classpath" 





main () 函数 不 变 ， 修 改 startJVM () 函数 ， 
改动 如 下 : 





func startJVM(cmd *Cmd) { 


cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
className := strings.Replace(cmd.class, ".", "/", -1) 
cf := loadClass(className, cp) 
mainMethod := getMainMethod(cf) 
If mainMethod != nil { 

interpret(mainMethod) 
} else { 


fmt.Printf("Main method not found in class %s\n", cmd.cl 





startJVM 〈) 首先 调用 loadClass〈) 方法 读 取 
并 解析 class 文 件 ， 然 后 调用 getMainMethod 〈) 了 郴 
数 查 找 类 的 main() 方法 ， 最 后 调用 interpret () 
函数 解释 执行 main〈() 方法 。loadClass 〈() 函数 的 
代码 如 下 : 








func loadClass(className string, cp *classpath.Classpath) *cla 
classData, _, err := cp.ReadClass(className) 
if err != nil { 
panic(err) 


cf, err := classfile.Parse(classData) 
if err != nil { 

panic(err) 
} 


return cf 





getMainMethod () 函数 的 代码 如 下 : 





func getMainMethod(cf *classfile.ClassFile) *classfile.MemberI 
for _, m := range cf.Methods() { 
if m.Name() == "main" && m.Descriptor() == "([Ljava/lang 
return m 


} 


return nil 


打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 代 
但。 


go install jvmgoxcho05 


编译 成 功 后 ， 在 D: \go\Wworkspace\bin 目 录 下 会 
出 现 ch05.exe 文 件 。 用 javac 编 译 GaussTest 类 ， 然 后 
用 ch05.exe 执 行 GaussTest 程 序 ， 结 果 如 图 5-3 所 示 。 
注意 一 定 要 保证 可 以 在 当前 目录 下 找到 
GaussTest.class 文 件 ， 人 否则 应 访 用 -cp 选项 指定 用 户 
半路 径 。 





D:\go\workspace\bin>ch05, exe -Xijre ‘C:\Program Files\Java\jrel, 8.0 66”jvmgo.boo 
k. ch05. GaussTest 
: 0 inst:*constants. ICONST 0 &{0) 
inst:*stores. ISTORE 1 &{0} 
inst:*constants. ICONST_1 &{0} 
inst:*stores. ISTORE 2 &{0} 
inst:*loads,. ILOAD 2 有 &T[T 
inst:*constants. BIPUSH &{100} 


一 心 CD CD -、— 


inst:*comparisons. IF_ICHPGT & { {13}} 
:10 inst:*loads. ILOAD 1 &{0} 


图 5-3 ”GaussTest 程 序 执行 结果 (1) 
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方法 执行 ， 并 打印 出 了 执行 过 的 指令 。 在 我 们 
预料 之 中 ， 方 法 执行 的 最 后 出 现 了 错误 ， 局 部 变量 
表 和 操作 数 栈 的 状态 也 打印 了 出 来 ， 如 图 5-4 所 
示 。 仔 细 观 察 局 部 变量 表 可 以 看 到 5050 这 个 数字 ， 
这 正 是 我 们 的 计算 结果 ! 





pe: 5 inst:*constants. BIPUSH &{100} 

pc: 7 inst:*comparisons. IE_ICNP6T &{{13}} 
LocalVYars:[ {0 <nil>»} {5050 <nil>} {101 <ni1>}] 
DperandStack:&{0 [ {i101 <nil> {100 <nil>} jj 


panic: Unsupported opcode: Oxb2! [recovered] 
panic: Unsupported opcode: Oxb2! 


goroutine 1 [running]: 
main. catchhrr (Oxc082abdl180) 
D:/go/workspace/src/ jvmeo/ ch05D/interpreter. go:27 +0x22e 





图 5-4 ”GaussTest 程 序 执行 结果 (2) 


5.14 ”本章 小 结 


虽然 还 有 很 多 缺陷 ,但 是 我 们 的 Java 虚 拟 机 已 
经 可 以 解释 执行 字 节 码 了 ， 这 是 一 个 很 大 的 进步 ! 
下 一 章 将 讨论 类 和 对 象 在 内 存 中 的 布局 ， 并 且 开 始 
实现 引用 类 指令 。 还 等 什么 ? 快 来 阅读 吧 ! 


第 6 草 ” 关 和 对 和 象 


在 第 4 章 ， 我 们 初步 实现 了 线程 私有 的 运行 时 
数据 区 ， 在 此 基础 上 ， 第 5 章 实 现 了 一 个 简单 的 解 
释 器 和 150 多 条 指令 。 这 些 指令 主要 是 操作 局 部 变 
量 表 和 操作 数 栈 、 进 行 数 学 运算 、 比 较 运 算 和 跳 转 
控制 等 。 本 章 将 实现 线程 共享 的 运行 时 数据 区 ， 包 
括 方法 区 和 运行 时 常量 池 。 


第 2 章 实现 了 类 路 径 ， 可 以 找到 class 文 件 ， 并 把 
数据 加 载 到 内 存 中 。 第 3 章 实现 了 class 文 件 解析 ， 可 
以 把 class 数 据 解析 成 一 个 ClassFile 结 构 体 。 本 章 将 进 

步 处 理 ClassFile 结 构 体 ， 把 它 加 以 转换 ， 放 进 方 
法 区 以 供 后 续 使 用 。 本 章 还 会 初步 讨论 类 和 对 象 的 
设计 ， 实 现 一 个 简单 的 类 加 载 器 ， 并 且 实 现 类 和 对 


象 相关 的 部 分 指令 。 


在 开始 学 习 本 章 之 前 ， 还 是 先 把 目录 结构 准备 
好 。 复 制 ch05 目 录 ， 改 名 为 ch06。 修 改 main.go 等 文 
件 ， 把 impott 语 名 中 的 ch05 全 都 改 成 ch06， 然 后 在 
ch06Nttda 目 录 中 创建 heap 子 目录 。 现 在 目录 结构 看 
起 来 应 该 是 下 面 这 样 : 


D:\go\workspace\src 
| -jvmgo 
|-cho1 ~ ch05 
|-cho6 
-classfile 
-classpath 
-instructions 
-rtda 
|-heap 
-cmd.go 
-interpreter.go 
-main.go 


在 第 4 章 中 ， 在 ftdaNobjectgo 文 件 中 定义 了 临时 
的 Object 结 构 体 。 现 在 可 以 把 object.go 移 到 heap 目 录 
下 了 。 注 意 要 修改 包 名 ， 代 码 如 下 : 


package heap 

type Object Struct { 
// todo 

} 

还 需要 修改 slotgo、local_vats.go 和 
operand_stack.go 这 三 个 文件 ， 在 其 中 添加 heap 包 的 
impotrt 语 多 ， 并 把 *Object 改 成 ksheap.Object。 以 上 改 
动 不 大 ， 为 了 节约 篇 幅 ， 这 里 就 不 给 出 具体 代码 


有 


6.1 方法 区 


此 4 章 人 简单 讨论 过 方法 区 ， 它 是 运行 时 数据 区 
的 一 块 逻辑 区 域 ， 由 多 个 线程 共享 。 方 法 区 主要 存 
放 从 class 文 件 获 取 的 类 人 信息。 此外， 类 变量 也 存放 
在 方法 区 中 。 当 Java 虚 拟 机 第 一 次 使 用 东 个 类 时 ， 
它 会 搜索 类 路 径 ， 找 到 相应 的 class 文 件 ， 然 后 读 取 
并 解析 class 文 件 ， 把 相关 信息 放 进 方法 区 。 人 至 于 方 
法 区 到 后 位 于 何 处 ， 是 固定 大 小 还 是 动态 调整 ， 是 
个 参与 垃圾 回收 ， 以 及 如 何在 方法 区 内 存放 类 数据 
等 ，Java 虚 拟 机 规范 并 没有 明确 规定 。 








先 来 看 看 有 哪些 信息 需要 放 进 方法 区 。 





6.1.1 类 信息 


使 用 结构 体 来 表示 将 要 放 进 方法 区 内 的 类 。 在 
ch06rtda\heap 目录 下 创建 cass.go 文 件 ， 在 其 中 定义 


Class 


结构 体 ， 代 码 如 下 : 





package heap 


import "jvmgo/cho6/classfile" 


type Class struct { 
accessFlags 
name 
superClassName 
interfaceNames 
constantPool 
fields 
methods 
loader 
superClass 
interfaces 
instanceSlotCount 
staticSlotCount 
staticVars 


uint16 

string // thisClassName 
string 
[]string 
*ConstantPool 
[]*Field 
[]*Method 
*ClassLoader 
*Class 
[]*Class 

uint 

uint 

*Slots 





号 


accessFlags 是 类 的 访问 标志 ， 总 共 16 比 特 。 
段 和 方法 也 有 访问 标志 ， 但 具体 标志 位 的 含义 可 能 


有 所 不 同 。 根 据 Java 虚 拟 机 规范 ， 把 各 个 比特 位 的 
含义 统一 定义 在 heapvaccess_flags.go 文 件 中 ， 代 三 
如 下 : 








package heap 


Ox1000 // class field method 
Ox2000 // class 
Ox4000 // class field 


ACC_SYNTHETIC 
ACC_ANNOTATION 
ACC_ENUM 


const ( 

ACC_PUBLIC = 0X0001 // class field method 
ACC_PRIVATE = Ox0002 // field method 
ACC_PROTECTED = 0X0004 // field method 
ACC_STATIC = 0X0008 // field method 
ACC_FINAL = 0X0010 // class field method 
ACC_SUPER = 0X0020 // class 
ACC_SYNCHRONIZED = 0X0020 // method 
ACC_VOLATILE = 0X0040 // field 
ACC_BRIDGE = 0X0040 // method 
ACC_TRANSIENT = 0X0080 // field 
ACC_VARARGS = 0X0080 // method 
ACC_NATIVE = 0X0100 // method 
ACC_INTERFACE = 0X0200 // class 

ACC_ABSTRACT = 0X0400 // class method 
ACC_STRICT = 0X0800 // method 





回 到 Class 结 构 体 。name、superClassName 和 
interfaceNames 字 段 分 别 存 放 类 名 、 超 类 名 和 接口 


名 。 注 意 这 些 类 名 都 是 完全 限定 名 ， 有 共有 


java/lang/Object 的 形式 。constantPool 字 段 存放 运行 
时 常量 池 指 针 ，fields 和 methods 字 上 段 分 别 存放 字段 
表 和 方法 表 。 运 行 时 常量 池 将 在 6.2 节 中 详细 介绍 。 


继续 编辑 class.go 文 件 ， 在 其 中 定义 
newClass () 函数 ， 用 来 把 ClassFile 结 构 体 转换 成 
Class 结 构 体 ， 代 码 如 下 : 





func newClass(cf *classfile.ClassFile) *Class { 
class := &Classt{} 
class.accessFlags = cf.AccessFlags() 
class.name = cf.ClassName() 
class.superClassName = cf.SuperClassName() 
class.interfaceNames = cf.InterfaceNames() 
class.constantPool = newConstantPool(class, cf.ConstantPool 


6.2 小 节 


class.fields = newFields(class, cf.Fields()) // 见 


6.1.2 小 节 


class.methods = newMethods(class, cf.Methods()) // 见 


6.1.3 小 节 


return class 


newClass〈) 函数 又 调用 了 
newConstantPool () 、newFields () 和 
newMethods〈《) ， 这 三 个 函数 的 代码 将 在 后 面 的 小 
节 给 出 。 继 续 编 辑 class.go 文 件 ， 在 其 中 定义 8 个 方 
法 ， 用 来 判断 某 个 访问 标志 是 否 被 设置 。 这 8 个 方 
法 都 很 简单 ， 为 了 市 约 篇 幅 ， 这 里 只 给 出 
IsPublic() 方法 的 代码 。 


func (self *Class) IsPublic() bool { 
return © != self.accessFlags&ACC_ PUBLIC 
} 


后 面 将 要 介绍 的 Field 和 Method 结 构 体 也 有 类 似 
的 方法 ， 届 时 也 将 不 再 警 述 ， 请 读者 注意 。 


6. A 字段 信息 


字段 和 方法 都 属于 类 的 成 员 ， 它 们 有 一 些 相同 
的 信息 (访问 标志 、 名 字 、 描 述 符 ) 。 为 了 避免 重 
复 代 码 ， 创 建 一 个 结构 体 存放 这 些 信息 。 在 
ch06\rtda\heap 目 录 下 创建 class_member.go 文 件 ， 在 
其 中 定义 ClassMember 结 构 体 ， 代 码 如 下 : 





package heap 
import "jvmgo/cho6/classfile" 
type ClassMember struct { 


accessFlags uint16 
name String 
descriptor String 
class *Class 


func (self *ClassMember) copyMemberInfo(memberInfo *classfile. 


前 面 三 个 字段 的 含义 很 明显 ， 这 里 不 多 解释 。 
class 字 有 段 存 放 Class 结 构 体 指针 ， 这 样 可 以 通过 字段 
或 方法 访问 到 它 所 属 的 类 。copyMemberInfo 〈) 方 





法 从 class 文 件 中 复制 数据 ， 代 码 如 下 : 





func (self *ClassMember) copyMemberIinfo(memberInfo *classfile. 
self.accessFlags = memberInfo.AccessFlags() 
self.name = memberInfo.Name() 
self.descriptor = memberIinfo.Descriptor() 





ClassMember 定 义 好 了 ， 接 下 来 在 
ch06Nrtdaheap 目 录 下 创建 field.go 文 件 ， 在 其 中 定义 
Field 结 构 体 ， 代 码 如 下 : 





package heap 

import "jvmgo/cho6/classfile" 

type Field Struct { 
ClassMember 


func newFields(class *Class, cfFields [|]*classfile.MemberInfo) 





Field 结 构 体 比较 简单 ， 目 前 所 有 信息 都 古 从 
ClassMember 中 继承 过 来 的 。newFields () 函数 根 
据 class 文 件 的 字段 信息 创建 字段 表 ， 代 人 码 如 下 : 





func newFields(class *Class, cfFields [|]*classfile.MemberInfo) 


fields := make([]*Field, len(cfFields)) 

for i, cfField := range cfFields { 
fields[i] = &Field{} 
fields[il].class = class 
fields[i].copyMemberInfo(cfField) 

} 


return fields 


6.1.3 ”方法 信息 


方法 比 字 段 稍 微 复杂 一 些 ， 因 为 方法 中 有 字 节 
人 码 。 在 ch06Ntdaheap 目 录 下 创建 method.go 文 件 ， 在 
其 中 定义 Method 结 构 体 ， 代 码 如 下 : 
package heap 


import "jvmgo/cho6/classfile" 
type Method struct { 


ClassMember 

maxStack uint 
maxLocals uint 
code [jbyte 


func newMethods(class *Class, cfMethods [J]*classfile.MemberInf 


maxStack 和 maxLocals 字 段 分 别 存放 操作 数 栈 
和 局 部 变量 表 大 小 ， 这 两 个 值 是 由 Java 编 译 器 计算 





好 的 。code 字 段 存放 方法 字 节 伺 。newMethods () 
函数 根据 cdlass 文 件 中 的 方法 信息 创建 Method 表 ， 代 
公 如 下 : 





func newMethods(class *Class, cfMethods []*classfile.MemberInf 
methods := make([]*Method, len(cfMethods)) 
for i, cfMethod := range cfMethods { 
methods[I] = &Method{} 
methods[il].class = class 
methods[i].copyMemberInfo(cfMethod) 
methods[i].copyAttributes(cfMethod) 


return methods 





大 家 还 记得 吗 ? maxStack、maxLocals 和 字 
码 在 class 文 件 中 是 以 属性 的 形式 存储 在 method_info 
结构 中 的 。 如 果 读 者 已 经 忘记 的 话 ， 可 以 参考 3.4.5 
小 节 。copyAttributes () 方法 从 method_info 结 构 中 
提取 这 些 信息 ， 代 码 如 下 : 





func (self *Method) copyAttributes(cfMethod *classfile.MemberI 
if codeAttr := cfMethod.CodeAttribute(); codeAttr != nil { 
self.maxStack = codeAttr.MaxStack() 
self.maxLocals = codeAttr.MaxLocals() 
self.code = codeAttr.Codel() 
} 
} 





到 此 为 止 ， 除 了 ConstantPool 还 没有 介绍 以 


外 ， 已 经 定义 了 4 个 结构 体 ， 这 些 结构 体 之 间 的 关 
系 如 图 6-1 所 示 。 


ConstantPool -上 14 Class ClassMember 





图 6-1 Class 结 构 体 关系 图 


6.1.4 其 他 信息 


Class 结 构 体 还 有 几 个 字段 没有 说 明 。loader 字 
段 存 放 类 加 载 器 指针 ，superClass 和 interfaces 字 段 存 
放 类 的 超 类 和 接口 指针 ， 这 三 个 字段 将 在 6.3 市 介 
绍 。staticSlotCount 和 instanceSlotCount 字 段 分 别 存 
放 关 变量 和 实例 变量 占据 的 空间 大 小 ，staticVars 字 
段 存放 静态 变量 ， 这 三 个 字段 将 在 6.4 贡 介绍 。 








运行 时 常量 池 主 要 存放 两 类 信息 : 字面 量 
(literal〉 和 符号 引用 (symbolic reference) 。 字 面 
量 包 括 整 数 、 浮 点 数 和 字符 串 字 和 面 量 ; 符号 引用 包 
括 交 符号 引用 、 字 段 符 号 引用 、 方 法 符号 引用 和 接 
口 方法 符号 引用 。 在 ch06Ntda\heap 目 录 下 创建 
constant_pool.go 文 件 ， 在 其 中 定义 Constant 接 口 和 
ConstantPool 结 构 体 ， 代 码 如 下 : 








package heap 
import "fmt" 
import "jvmgo/cho6/classfile" 
type Constant interface{} 
type ConstantPool struct { 
class *Class 
consts [1]Constant 


func newConstantPool(class *Class, cfCp classfile.ConstantPool 
func (self *ConstantPool) GetConstant(index uint) Constant {.. 


GetConstant 〈) 方法 根据 索引 返回 和 常量， 代码 
如 下 : 





func (self *ConstantPool) GetConstant(index uint) Constant { 
if c := self.consts[index]; c != nil { 
return c 


panic(fmt.Sprintf("No constants at index %d", index)) 


. 





newConstantPool () 函数 把 class 文 件 中 的 稼 量 
池 转 换 成 运行 时 常量 池 。 这 个 函数 稍微 有 点 复 森 ， 
主体 代码 如 下 : 





func newConstantPool(class *Class, cfCp classfile.ConstantPool 
cpCount := len(cfcCp) 


consts := make([]Constant, cpCount) 
rtCcp := &ConstantPool{class, consts} 
for i := 1; i < cpCount; i++ { 


cpInfo := cfCp[i] 
Switch cpInfo.(type) { 


} 


return rtcp 


[EE | 


其 实 也 不 难 理 解 ， 核 心 逻 辑 束 是 把 
[Jclassfile.ConstantInfo 转 换 成 []heap.Constant。 具 体 


第 量 的 转换 在 Switch-case 中 ， 我 们 分 儿 次 来 看 。 


I 第 量 ， 生 接 取出 常量 


型 常量 


i 








最 简单 的 是 int 或 float 


值 ， 放 进 consts 中 即 可 。 





Switch cpInfo.(type) { 
case *classfile.ConstantIintegerIinfo: 
= cpInfo.(*classfile.ConstantIintegerInfo) 


IntInfo : 
consts[i] = intInfo.Value() // int32 
case *classfile.ConstantFloatIinfo: 
floatIinfo := cpInfo.(*classfile.ConstantFloatInfo) 
consts[i] = floatInfo.Value() // float32 





如 果 是 long 或 double 型 常量 ， 也 是 直接 提取 党 
量 值 放 进 consts 中 。 但 是 要 注 间 ， 这 两 种 类 型 的 津 


量 在 币 量 池 中 都 是 占据 两 个 位 置 ， 所 以 索引 要 特殊 








case *classfile.ConstantLongInfo: 
longInfo := cpInfo.(*classfile.ConstantLongInfo) 


consts[i] = LongInfo.Value() // int64 
了 十 十 
case *classfile.ConstantDoubleInfo: 
doubleInfo := cpInfo.(*classfile.ConstantDoubleIinfo) 
consts[i] = doubleInfo.Value() // float64 
工 十 十 

















如 果 是 字符 串 常 量 ， 直 接 取 出 Go 语言 字符 串 ， 
放 进 consts 中 ， 代 人 码 如 下 : 





case *classfile.ConstantStringInfo: 
stringInfo := cpInfo.(*classfile.ConstantSstringInfo) 
consts[i] = stringInfo.String() // string 





还 剩 下 4 种 类 型 的 各 量 需 要 处 理 ， 分 别 是 类 、 
字段 、 方 法 和 接口 方法 的 符号 引用 。 后 面 的 章节 
详细 介绍 这 4 种 符号 引用 ， 下 面 是 剩 下 的 代码 。 





case *classfile.ConstantClassInfo: 
classInfo := cpInfo.(*classfile.ConstantClassInfo) 
consts[i] = newClassRef(rtcp, classInfo) // 见 


6.2.1 小 节 


case *classfile.ConstantFieldrefInfo: 
fieldrefIinfo := cpInfo.(*classfile.ConstantFieldrefInfo) 


consts[i] = newFieldRef(rtcp, fieldrefInfo) // 见 


6.2.2 未 苇 


case *classfile.ConstantMethodrefInfo: 
methodrefInfo := cpInfo.(*classfile.ConstantMethodrefInfo ) 
consts[i] = newMethodRef(rtCcp，methodrefInfo) // 见 


6.2.3 小 节 


case *classfile.ConstantIinterfaceMethodrefIinfo: 
methodrefInfo := cpInfo.(*classfile.ConstantIinterfaceMethod 
consts[i] = newInterfaceMethodRef(rtCcp，methodrefInfo) // ; 


6.2.4 小 节 








基本 类 型 和 常量 的 使 用 请 参考 6.4 市 。 


6.2.1 类 符号 引用 


因为 4 种 类 型 的 符号 引用 有 一 些 共 性 ， 所 以 仍 
然 使 用 继承 来 减少 重复 代码 。 在 ch06\rtda\heap 目 录 
下 创建 cp_symref.go 文 件 ， 在 其 中 定义 SymRef 结 构 
体 ， 代 码 如 下 : 





package heap 
// symbolic reference 
type SymRef struct { 


cp *ConstantPool 
className string 
class *Class 


cp 字段 存放 符 写 引用 所 在 的 运行 时 常量 池 指 
针 ， 这 样 就 可 以 通过 符号 引用 访问 到 运行 时 第 量 
池 ， 进 一 步 又 可 以 访问 到 闫 数据。className 字 段 
存放 类 的 完全 限定 名 。class 字 段 缓存 解析 后 的 类 结 





构 体 指针 ， 这 样 类 符 写 引用 只 需要 解析 一 次 就 可 以 
了 ， 后 续 可 以 直接 使 用 缓存 值 。 对 于 类 符 写 引用 ， 

只 要 有 类 名 ， 束 可 以 解析 符 写 引用 。 对 于 字段 ， 首 
要 解析 类 符号 引用 得 到 类 数据 ， 然 后 用 字段 名 和 
描述 符 奉 找 字 段 数据 。 方 法 符号 引用 的 解析 过 程 和 


字段 符 写 引用 类 似 。 








ci 


SymRef 定 义 好 了 ， 接 下 来 在 ch06\rtda\heap 目 录 
下 创建 cp_classref.go 文 件 ， 在 其 中 定义 ClassRef 结 
构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type ClassRef struct { 

SymRef 


func newClassRef(cp *ConstantPool, 
classInfo *classfile.ConstantClassInfo) *ClassRef {...} 


ClassRef 继 承 了 SymRef， 但 是 并 没有 添加 任何 


字段 。newClassRef () 函数 根据 dass 文 件 中 存储 的 
类 常量 创建 ClassRef 实 例 ， 代 码 如 下 : 





func newClassRef(cp *ConstantPool, 
classInfo *classfile.ConstantClassIinfo) *ClassRef { 
ref := &ClassRef{} 
ref.cp = cp 
ref.className = classInfo.Namel() 
return ref 


} 





类 符号 引用 的 解析 将 在 6.5.2 节 讨论 。 


6.2.2 ”字段 符号 引用 


在 6.1.2 节 中 ， 定 义 了 ClassMember 结 构 体 来 存 
放 字 段 和 方法 共有 的 信息 。 类 似 地 ， 本 节 定 义 
MemberRef 结 构 体 来 存放 字段 和 方法 符号 引用 共有 
的 信息 。 在 ch06\rtda\heap 目 录 下 创建 
cp_memberref.go 文 件 ， 在 其 中 定义 MemberRef 结 构 
体 ， 代 码 如 下 : 











package heap 

import "jvmgo/cho6/classfile" 

type MemberRef struct { 
SymRef 
name String 
descriptor String 


} 
func (self *MemberRef) copyMemberRefInfo( 
refInfo *classfile.ConstantMemberrefIinfo) {...} 


读者 可 能 会 有 疑问 : 在 Java 中 ， 我 们 并 不 能 在 
同一 个 类 中 定义 名 字 相 同 ， 但 类 型 不 同 的 两 个 字 





字段 符号 引用 为 什么 还 要 存放 字段 摘 述 
戎 是 ， 这 只 是 Java 语 言 的 限制 ， 而 不 是 Java 
虚拟 机 规范 的 限制 。 也 就 是 说 ， 站 在 Java 虚 拟 机 的 
角度 ， 一 个 类 是 完全 可 以 有 多 个 同名 字段 的 ， 只 要 
它们 的 类 型 互 不 相同 就 可 以 。 

copyMemberRefInfo 〈) 方法 从 class 文 件 内 存储 的 
字段 或 方法 癌 量 中 提取 数据 ， 代 码 如 下 : 








func (self *MemberRef) copyMemberRefInfo(refInfo *classfile,Co 
self.className = refIinfo.ClassName() 
self.name, self.descriptor = refIinfo.NameAndDescriptor() 


: 


MemberRef 定 义 好 了 ， 接 下 来 在 ch06\rtda\heap 
目录 下 创建 cp_fieldref.go 文 件 ， 在 其 中 定义 FieldRef 
结构 体 ， 代 码 如 下 : 


package heap 

import "jvmgo/cho6/classfile" 

type FieldRef struct { 
MemberRef 


field *Field 
} 
func newFieldRef(cp *ConstantPool, 
refInfo *classfile.ConstantFieldrefIinfo) *FieldRef {...} 





field 字 段 缓存 解 析 后 的 字段 指针 ， 
newFieldRef () 方法 创建 FieldRef 实 例 ， 代 人 码 如 
下 : 





func newFieldRef(cp *ConstantPool, 
refInfo *classfile.ConstantFieldrefIinfo) *FieldRef { 
ref := &FieldRef{} 
ref.cp = cp 
ref .copyMemberRefInfo(&refIinfo.ConstantMemberrefInfo) 
return ref 





字段 符号 引用 的 解析 将 在 6.5.2 节 讨论 。 


6.2.3 ”方法 符号 引用 


在 ch06\rtda\heap 目 录 下 创建 cp_methodref.go 文 
件 ， 在 其 中 定义 MethodRef 结 构 体 ， 代 码 如 下 : 





package heap 
import "jvmgo/cho6/classfile" 
type MethodRef struct { 
MemberRef 
method *Method 
} 
func newMethodRef(cp *ConstantPool, 
refInfo *classfile.ConstantMethodrefIinfo) *MethodRef { 
ref := &MethodRef{} 
ref.cp = cp 
ref .copyMemberRefInfo(&refInfo.ConstantMemberrefInfo) 
return ref 








上 面 的 代码 和 字段 符 写 引用 大 同 小 异 ， 这 里 就 
不 多 解释 了 。 方 法 符号 引用 的 解析 将 在 第 7 章 讨 论 
方法 调用 时 详细 介绍 。 


6.2.4 接口 方法 符号 引用 


在 ch06\rtda\heap 目 录 下 创建 
cp_interface_methodref.go 文 件 ， 在 其 中 定义 
Interface-MethodRef 结 构 体 ， 代 码 如 下 : 





package heap 
import "jvmgo/cho6/classfile" 
type InterfaceMethodRef struct { 
MemberRef 
method *Method 


func newInterfaceMethodRef(cp *ConstantPool, 
refInfo *classfile.ConstantIinterfaceMethodrefIinfo) *Inte 
ref := &InterfaceMethodRef{} 
ref.cp = cp 
ref .copyMemberRefInfo(&refInfo.ConstantMemberrefInfo) 
return ref 


} 


代码 和 前 面 兰 不 多 ， 也 不 多 解释 了 。 接 口 方法 
符号 引用 的 解析 同样 会 在 第 7 草 详细 介绍 。 到 此 为 
止 ， 所 有 的 符号 引用 都 已 经 定义 好 了 ， 它 们 的 继承 





结构 如 图 6-2 所 示 。 


SymRef 
ClassRef MemberRef 
Interface MethodRef MethodRef FieldRef 


图 6-2 符号 引用 结构 体 继承 关系 图 


6.3 ”类 加 载 右 


Java 虚 拟 机 的 类 加 载 系统 十 分 复 人 淋 ， 本 市 将 初 
步 实 现 一 个 宙 化 版 的 类 加 载 锋 ， 后 面 的 章节 中 还 会 
对 它 进行 扩展 。 在 ch06/rtda/heap 目 录 下 创建 
class_loader.go 文 件 ， 在 其 中 定义 ClassLoader 结 构 
体 ， 代 码 如 下 : 








package heap 
import "fmt" 
import "jvmgo/cho6/classfile" 
import "jvmgo/cho6/classpath" 
type ClassLoader Struct { 
cp *classpath.Classpath 
classMap map[lstringl]*Class // loaded classes 


func NewClassLoader(cp *classpath.cClasspath) *CclassLoader {... 
func (self *ClassLoader) LoadClass(name string) *Class {...} 


ClassLoader 依 赖 Classpath 来 搜索 和 读 取 class 文 
件 ，cp 字 段 保 存 Classpath 指 针 。classMap 字 段 记 录 





己 经 加 载 的 类 数据 ，key 征 闫 的 完全 限定 名 。 在 前 
面 讨 论 中 ， 方 法 区 一 直 只 是 个 抽象 的 概念 ， 现 在 可 
以 把 classMap 字 段 当 作 方 法 区 的 具体 实现 。 
NewClassLoader 〈) 函数 创建 ClassLoader 实 例 ， 代 
码 比 较 简 单 ， 如 下 上 所 示 : 





func NewClassLoader(cp *classpath.Classpath) *ClassLoader { 
return &ClassLoadert{ 
cp: cp, 
classMap: make(map[string]*Class), 





LoadClass () 方法 把 类 数据 加 载 到 方法 区 ， 代 
伺 如 下 : 





func (self *ClassLoader) LoadClass(name string) *Class { 
if class, ok := self.classMap[namel]; ok { 
return class // 类 已 经 加 载 


return self.loadNonArrayClass (nanme) 


} 





先 碍 找 classMap， 看 类 是 否 已 经 被 加 载 。 如 果 
是 ， 直 接 返 回 类 数据 ， 和 否则 调用 
loadNonArrayClass〈) 方法 加 载 类 。 数 组 类 和 普通 
类 有 很 大 的 不 同 ， 它 的 数据 并 不 是 来 自 class 文 件 ， 
而 是 由 Java 虚 拟 机 在 运行 期 间 生 成 。 本 章 暂 不 考虑 
数组 类 的 加 载 ， 留 到 第 8 章 详 细 讨 论 。 
loadNonArrayClass〈) 方法 的 代码 如 下 : 





func (self *ClassLoader) loadNonArrayClass(name string) *Class 


data, entry := self.readClass(name) 
class := self.defineClass(data) 
link(class) 


fmt.Printf("[Loaded %s from %s]\n", name, entry) 
return class 


可 以 看 到 ， 交 的 加 载 大 致 可 以 分 为 三 个 步 又; 
首先 找到 class 文 件 并 把 数据 读 取 到 内 存 ;， 然后 解析 
class 文 件 ， 生 成 虚拟 机 可 以 使 用 的 类 数据 ， 并 放 入 
方法 区 ; 最 后 进行 链接 。 下 面 分 别 讨论 这 三 个 步 


又 。 


6.3.1 readClass () 


readClass () 方法 的 代码 如 下 : 


func (self *ClassLoader) readClass(name string) ([lbyte, class 
data, entry, err := self.cp.ReadClass(name) 
if err != nil { 
panic("java.lang.ClassNotFoundException: " + name) 


return data, entry 


} 


readClass〈) 方法 只 是 调用 了 Classpath 的 
ReadClass《〈) 方法 ， 并 进行 了 错误 处 理 。 需 要 解释 
一 下 它 的 返回 值 。 为 了 打印 类 加 载 信息 ， 把 最 终 加 
载 class 文 件 的 类 路 径 项 也 返回 给 了 调用 者 。 








6.3.2 defineClass () 


defineClass 〈) 方法 的 代码 如 下 : 


func (self *ClassLoader) defineClass(data [lbyte) *Class { 
class := parseClass(data) 
class.loader = self 
resolveSuperClass(class) 
resolveInterfaces(class) 
self.classMap[class.name|] = class 
return class 


defineClass〈) 方法 首先 调用 parseClass () 也 
数 把 class 文 件数 据 转换 成 Class 结 构 体 。Class 结 构 体 
的 superClass 和 interfaces 字 上 段 存放 超 类 名 和 直接 接口 
表 ， 这 些 类 名 其 实 都 是 符 写 引用 。 根 据 Java 虚 拟 机 
规范 的 5.3.5 节 ， 调 用 resolveSuperClass () 和 
resolveInterfaces〈) 函数 解析 这 些 类 符 与 引用 。 下 


面 是 parseClass () 函数 的 代码 。 


func parseClass(data []byte) *Class { 
cf, err := classfile.Parse(data) 
if err != nil { 
panic("java.lang.ClassFormatError") 


return newClass(cf) // 见 


6.1.1 小 节 





resolveSuperClass 〈() 了 水 数 的 代码 如 下 : 





func resolveSuperClass(class *Class) { 
If class.name != "java/lang/Object™" { 
class.superClass = class.loader.LoadClass(class.superCla 








再 复习 一 下 : 除 java.lang.Object 以 外 ， 所 有 的 
类 都 有 且 仅 有 一 个 超 类 。 因 此 ， 除 非 是 Object 类 ， 
否则 需要 递归 调用 LoadClass 〈) 方法 加 载 它 的 超 
类 。 与 此 类 似 ，resolveInterfaces 〈() 函数 递归 调用 
LoadClass《) 方法 加 载 类 的 每 一 个 直接 接口 ， 代 码 





如 下 : 





func resolveInterfaces(class *Class) { 
interfaceCount := len(class.interfaceNames) 
If interfaceCount > 0 { 
class.interfaces = make([]*Class, interfaceCount) 
for i, interfaceName := range class.interfaceNames { 
class.interfaces[i] = class.1loader.LoadClass(interfac 


} 


6.3.3 link () 


类 的 链接 分 为 验证 和 准备 两 个 必要 阶段 ， 
link() 方法 的 代码 如 下 : 


func link(class *Class) { 
verify(class) 
prepare(class) 


为 了 确保 安全 性 ，Java 虚 拟 机 规范 要 求 在 执行 
类 的 任何 代码 之 前 ， 对 类 进行 严格 的 验证 。 由 于 篇 
幅 的 原因 ， 本 书 忽略 验证 过 程 。Java 虚 拟 机 规范 
4.10 节 详细 介绍 了 类 的 验证 算法 ， 感 兴趣 的 读者 可 
以 尝试 自己 实现 。verify() 函数 空空 如 也 ， 代 码 
则 .下 











func verify(class *Class) { 
// todo 
} 


准备 阶段 主要 是 给 类 变量 分 配 空间 并 给 予 初 始 
值 ，prepare〈) 函数 推迟 到 6.4 市 再 介绍 。 


6.4 ”对象 、 实 例 变 量 和 类 变量 


在 第 4 章 中 ， 定 义 了 LocalVars 结 构 体 ， 用 来 表 
示 局 部 变量 表 。 从 逻辑 上 来 看 ，LocalVars 实 例 承 像 
一 个 数组 ， 这 个 数组 的 每 一 个 元 又 都 足够 容纳 一 个 
int、float 或 引用 值 。 要 放 入 double 或 者 long 值 ， 需 
要 相 邻 的 两 个 元 素 。 这 个 结构 体 不 是 正好 也 可 以 用 
来 表示 类 变量 和 实例 变量 吗 ? 


没 错 ! 但 是 ， 由 于 rtda 包 已 经 依赖 了 heap 包 ， 
而 Go 语言 的 包 又 不 能 相互 依赖 ， 所 以 heap 包 中 的 go 
文件 是 无 法 导入 rtda 包 的 ， 否 则 Go 编译 器 就 会 报 
错 。 为 了 解决 这 个 问题 ， 只 好 容忍 一 些 重 复 代 码 的 
存在 。 在 ch06\rtda\heap 目 录 下 创建 slots.go 文 件 ， 把 
slot.go 和 local_vars.go 文 件 中 的 内 容 找 贝 进来 ， 然 后 


在 此 基础 上 修改 ， 代 人 码 如 下 : 





package heap 
import "math" 


type Slot Struct { 


num int32 
ref *Object 


} 
type Slots [|]Slot 





函数 和 方法 的 内 容 部 没什么 变化 ， 为 了 市 约 篇 
幅 ， 束 不 给 出 详细 代码 了， 下面 是 列表 。 





func 
func 
func 
func 
func 
func 
func 
func 
func 
func 
func 


newSlots(slotCount uint) Slots {...} 


(self Slots) 
(self Slots) 
(self Slots) 
(self Slots) 
(self Slots) 
(self Slots) 
(self Slots) 
(self Slots) 
(self Slots) 
(self Slots) 


SetIint(index uint, val int32) {...} 
GetInt(index uint) int32 {...} 
SetFloat(index uint, val float32) {...} 
GetFloat(index uint) float32 {...} 
SetLong(index uint, val int64) {...} 
GetLong(index uint) int64 {...} 
SetDouble(index uint, val float64) {...} 
GetDouble(index uint) float64 {...} 
SetRef(index uint, ref *Object) {...} 
GetRef(index uint) *Object {...} 





Slots 结 构 体 准备 就 绕 ， 可 以 使 用 了 。Class 结 构 





体 早 在 6.1 市 就 定义 好 了 ， 代 码 如 下 : 





type Class Struct { 


staticVars *Slots 


打开 ch06\rtda\heap\object.go 文 件 ， 给 Object 结 
构 体 添加 两 个 字段 ， 一 个 存放 对 象 的 Class 指 针 ， 一 
个 存放 实例 变量 ， 代 人 码 如 下 : 


type Object struct { 
class *Class 
fields Slots 

} 


接 下 来 的 问题 是 ， 如 何 知 中 静态 变量 和 实例 变 
量 需要 多 少 空 间 ， 以 及 哪个 字段 对 应 Slots 中 的 哪个 


位 置 呢 ? 








第 一 个 问题 比较 好 解决 ， 只 要 数 一 下 类 的 字段 
即 可 。 假 设 攻 个 类 有 m 个 静态 字段 和 n 个 实例 字段 ， 


那么 静态 变量 和 实例 变量 所 需 的 空间 大 小 就 分 别 是 





m' 和 mn。 这 里 要 注意 两 点 。 首 先 ， 类 是 可 以 继 素 
的 。 也 殴 是 六， 在 数 实例 变量 时 ， 要 递归 地 数 超 关 
的 实例 变量 ， 其 次 ，long 和 double 字 段 都 占据 两 个 
位 置 ， 所 以 m'>=m，n'>=n。 


第 二 个 问题 也 不 算 难 ， 在 数字 段 时 ， 给 字段 投 
顺序 编 上 号 就 可 以 了 。 这 里 有 三 点 需要 要 注意 。 首 
先 ， 诅 态 字段 和 实例 字段 要 分 开 编号 ， 人 否则 会 混 
乱 。 其 次 ， 对 于 实例 人 字段， 一定 要 从 继承 关系 的 最 
顶端 ， 也 就 是 java.lang.Object 开 始 编号， 天 则 也 会 


混乱 。 最 后 ， 编 号 时 也 要 考虑 1ong 和 double 类 型 。 








打开 field.go 文 件 ， 给 Field 结 构 体 加 上 slotId 字 
段 ， 代 码 如 下 : 


type Field struct { 
ClassMember 
slotId uint 

} 





打开 class_loader.go 文 件 ， 在 其 中 定义 
prepare 〈) 函数 ， 代 码 如 下 : 





func prepare(class *Class) { 
calcInstanceFieldSlotIds(class) 
calcStaticFieldSlotIds(class) 
allocAndInitStaticVars(class) 


} 





calcInstanceFieldSlotIds () 函数 计算 实例 字段 
的 个 数 ， 同 时 给 它们 编号， 代码 如 下 : 





func calcIinstanceFieldSlotIds(class *Class) { 
slotId := uint(0) 
if class.superClass != nil { 
slotId = class.superClass.instanceSlotCount 


} 
for _, field := range class.fields { 
If !field.IsStatic() { 
field.slotId = slotId 
slotId++ 
If field.isLongOrDouble() { 
SlotId++ 
} 
} 
} 
class.instanceSlotCount = slotId 


calcStaticFieldSlotIds 〈) 函数 计算 静态 字段 的 
个 数 ， 同 时 给 它们 编号 ， 代 码 如 下 : 





func calcStaticFieldSlotIids(class *Class) { 
slotId := uint(0) 
for _, field := range class.fields { 
If field.IsSstatic() { 
field.slotId = slotId 


slotId++ 
If field.isLongOrDouble() { 
SlotId++ 
} 
} 
} 
class.staticSlotCount = slotId 


. 





Field 结 构 体 的 isLongOrDouble 〈) 方法 返回 字 


段 是 否 是 long 或 double 类 型 ， 代 人 码 如 下 : 





func (self *Field) isLongOrDouble() bool { 
return self.descriptor == "J" || self.descriptor == "D" 


} 





allocAndInitStaticVars〈) 函数 给 类 变量 分 配 空 


间 ， 然 后 给 它们 赋予 初始 值 ， 代 码 如 下 : 


func allocAndInitStaticVars(class *Class) { 
class.staticVars = newSlots(class.staticSlotCount) 
for _, field := range class.fields { 
If field.IsStatic() && field.IsFinal() { 
initStaticFinalVar(class, field) 





因为 Go 语言 会 保证 新 创建 的 Slot 结 构 体 有 默认 
值 Cnum 字 段 是 0，ref 字 段 是 nil) ， 而 浮 点 数 0 编码 
之 后 和 整数 0 相同 ， 所 以 不 用 做 任何 操作 就 可 以 保 
证 静态 变量 有 默认 初始 值 〈 数 字 类 型 是 0， 引 用 类 
型 是 null) 。 如 果 静 态 变量 属于 基本 类 型 或 String 类 
型 ， 有 final 修 饰 符 ， 且 它 的 值 在 编译 期 已 知 ， 则 该 
值 存储 在 class 文 件 常 量 池 中 。initStaticFinalVar () 
函数 从 常量 池 中 加 载 常量 值 ， 然 后 给 静态 变量 赋 
值 ， 代 码 如 下 : 

















func initStaticFinalVar(class *Class, field *Field) { 
vars := class.staticVars 
cp := class.constantPool 
cpIndex := field.ConstValueIndex() 


SlotId := field.SlotId() 
If cpIndex > 0 { 
switch field.Descriptor() { 
case vz "B", "er "SY NT: 
val := cp.GetConstant(cpIndex). (int32) 
vars.SetInt(slotId, val) 
Case "J": 
val := cp.GetConstant(cpIndex). (int64) 
vars.SetLong(slotId, val) 
case "F": 
val := cp.GetConstant(cpIndex). (float32) 
vars.SetFloat(slotIid, val) 
case "D": 
val := cp.GetConstant(cpIndex). (float64) 
vars.SetDouble(slotId, val) 
case "Ljava/lang/String;": 
panic("todo") // 在 第 





字符 串 稼 量 将 在 第 8 章 讨 论 ， 这 里 先 调 用 
panic《〈) 函数 终止 程序 执行 。 需 要 给 Field 结 构 体 谎 
加 constValueIndex 字 段 ， 代 码 如 下 : 





type Field Struct { 


ClassMember 
constValueIndex uint 
slotId uint 





修改 newFields () 方法 ， 从 字段 属性 表 中 该 取 
constValueIndex， 代 码 改动 如 下 : 





func newFields(class *Class, cfFields [|]*classfile.MemberIinfo) 
fields := make([]*Field, len(cfFields)) 
for i, cfField := range cfFields { 
fields[i] = &Field{} 
fields[i].class = class 
fields[i].copyMemberInfo(cfField) 
fields[i].copyAttributes(cfField) 


return fields 





copyAttributes 《() 方法 的 代码 如 下 : 





func (self *Field) copyAttributes(cfField *classfile.MemberInf 
if valAttr := cfField.ConstantValueAttribute(); valAttr '!= 
self.constValueIndex = uint(valAttr.ConstantValueIndex() 
} 
} 





MemberInfo 结 构 体 的 ConstantValueIndex () 
方法 在 ch06\classfilemember_info.go 文 件 中 ， 代 码 
如 下 : 





func (self *MemberInfo) ConstantValueAttribute() *ConstantValu 
for _, attrIinfo := range self.attributes { 
Switch attrInfo,(type) { 
case *ConstantValueAttribute: 
return attrIinfo.(*ConstantValueAttribute) 


} 
} 


return nil 


6.5 ”类 和 字段 从 号 引用 解析 


本 市 讨论 类 符号 引用 和 字段 符 写 引用 的 解析 ， 


方法 符 写 引用 的 解析 将 在 第 7 革 讨 论 。 


6.5.1 类 符 配 引 用 解析 


打开 cp_symref.go 文 件 ， 在 其 中 定义 
ResolvedClass () 方法 ， 代 码 如 下 : 


func (self *SymRef) ResolvedClass() *Class { 
If self.class == nil 
self.resolveClassRef() 


return self.class 


如 果 类 人 符 写 引用 已 经 解析 ，ResolvedClass () 
方法 直接 返回 类 指针 ， 人 否则 调用 
resolveClassSRef〈) 方法 进行 解析 。Java 虚 拟 机 规范 
5.4.3.1 节 给 出 了 类 符 写 引用 的 解析 步 又 
resolveClassRef 〈) 方法 加 是 按照 这 个 步 又 编写 的 
《有 一 些 简 化 ) ， 代 码 如 下 : 





func (self *SymRef ) resolveClassRef() { 


d := self.cp.class 

c := d.loader.LoadClass(self.className) 

if Ic.isAccessibleTo(d) { 
panic("java.lang.IllegalAccessError") 


self.class = c 





通俗 地 讲 ， 如 果 类 DD 通过 符号 引用 N 引 用 类 C 的 
话 ， 要 解析 N， 先 用 DD 的 类 加 载 嚣 加载 Cc， 然后 检查 
D 是 否 有 权限 访问 C， 如 果 没 有 ， 则 抛 出 
IllegalAccessError 异 常 。Java 虚 拟 机 规范 5.4.4 节 给 出 
了 类 的 访问 控制 规则 ， 把 这 个 规则 翻译 成 Class 结 构 
体 的 isAccessibleTo() 方法 ， 代 码 如 下 (在 
class.go 文 件 中 ) : 


func (self *Class) isAccessibleTo(other *Class) bool { 
return self.IsPublic() || self.getPpackageName() == other ,ge 
} 


也 就 是 说 ， 如 果 类 DD 想 访 问 类 C， 需 要 满足 两 
个 条 件 之 一 : C 是 public， 或 者 C 和 DD 在 同一 个 运行 


时 包 内 。 第 11 草 再 讨论 运行 时 包 ， 这 里 先 简单 按照 
包 名 来 检查 。getPackageName 〈) 方法 的 代码 如 下 
(也 在 class.go 文 件 中 ) : 


func (self *Class) getPackageName() String { 
if i := strings.LastIindex(self.name, "/"); i >= 0{ 
return self.name[:i] 


return "" 


} 


比如 类 名 是 java/lang/Object， 则 它 的 包 名 吏 是 
java/lang。 如 果 类 定义 在 默认 包 中 ， 它 的 包 名 古 空 








6.5.2 ”字段 符号 引用 解析 


打开 cp_fieldref.go 文 件 ， 在 其 中 定义 
ResolvedField () 方法 ， 代 人 码 如 下 : 





func (self *FieldRef) ResolvedField() *Field { 
If self.field == nil { 
self.resolveFieldRef() 


return self.field 


| 


ResolvedField () 方法 与 ResolvedClass () 方 
法 大 同 小 异 ， 束 不 多 解释 了 。Java 虚 拟 机 规范 
5.4.3.2 节 给 出 了 字段 符号 引用 的 解析 步骤 ， 把 它 翻 


译 成 resolveFieldRef 〈) 方法 ， 代 码 如 下 : 


func (self *FieldRef) resolveFieldRrRef() { 


d := self.cp.class 
c := self.ResolvedClass() 
field := lookupField(c, self.name, self.descriptor) 


if field == nil { 
panic("java.lang.NoSuchFieldError") 


if !field.isAccessibleTo(d) { 
panic("java.lang.IllegalAccessError") 


} 
self.field = field 
} 





如 末 类 DD 想 通 过 字段 符号 引用 访问 类 C 的 菏 个 
字段 ， 首 先 要 解析 符号 引用 得 到 类 C， 然 后 根据 字 
段 名 和 描述 符 查 找 字 段 。 如 果 字段 查找 失败 ， 则 虚 
拟 机 抛 出 NoSuchFieldError 异 常 。 如 果 查 找 成 功 ， 
但 D 没 有 足够 的 权限 访问 该 字段 ， 则 虚拟 机 抛 出 
IllegalAccessError 寞 常 。 字 上 段 人 查找 步 又 在 
lookupField() 函数 中 ， 代 码 如 下 : 














func lookupField(c *Class, name, descriptor string) *Field { 
for _, field := range c.fields { 


if field.name == name && field.descriptor == descriptor 
return field 
} 
for _, iface := range c.interfaces { 
if field := lookupField(iface, name, descriptor); field 
return field 
} 
} 
If c.superClass != nil { 


return lookupField(c.superClass, name, descriptor) 


} 


return nil 





首先 在 C 的 字段 中 查找 。 如 果 找 不 到 ， 在 C 的 
直接 接口 递归 应 用 这 个 查找 过 程 。 如 果 还 找 不 到 的 
话 ， 在 C 的 超 类 中 递归 应 用 这 个 查找 过 程 。 如 果 仍 
然 找 不 到 ， 则 查找 失败 。Java 虚 拟 机 规范 5.4.4 节 也 
给 出 了 字段 的 访问 控制 规则 。 这 个 规则 同样 也 适用 
于 方法 ， 所 以 把 它 〈 略 做 简化 ) 实现 成 
ClassMember 结 构 体 的 isAccessibleTo() 方法 ， 代 
码 如 下 (在 class_member.go 文 件 中 ) : 














func (self *ClassMember) isAccessibleTo(d *Class) bool { 
If self.IsPublic() { 
return true 
} 
c := self.class 
if self.IsProtected() { 
return d == c || d.isSubClassof(c) || 
c.getPackageName() == d.getPackageName() 


} 
If !self.IsPrivate() { 
return c.getPpackageName() == d.getPackageName() 


return d == c 


用 通俗 的 语言 掏 述 字段 访问 规则 。 如 有 果 字 段 是 
public， 则 任何 类 都 可 以 访问 。 如 采 字 段 是 
protected， 则 只 有 子 类 和 同一 个 包 下 的 类 可 以 访 
问 。 如 果 字 上段 有 默认 访问 权限 〈 非 public， 非 
protected， 也 非 privated) ， 则 只 有 同一 个 包 下 的 类 
可 以 访问 。 否则 ， 字 段 是 private， 只 有 声明 这 个 字 
段 的 类 才能 访问 。 





6.6 ”类 和 对 象 相关 指令 





本 节 将 实现 10 条 类 和 对 象 相关 的 指令 。new 指 
令 用 来 创建 类 实例 ; putstatic 和 getstatic 指 令 用 于 存 
取 静 态 变 量 ，putfield 和 getfield 用 于 存 取 实例 变量 ; 
instanceof 和 checkcast 指 令 用 于 判断 对 象 是 否 属于 某 
种 类 型 ，ldc 系 列 指令 把 运行 时 常量 池 中 的 常量 推 到 
操作 数 栈 顶 。 下 面 的 Java 代 码 演示 了 这 些 指 令 的 用 
处 。 




















public class MyObject { 
public static int staticVar; 
public int instanceVar ; 
public static void main(String[] args) { 


int x = 32768 // ldc 

MyObject my0b]j] = new MyObject(); // new 

MyObject.staticVar = x; // putstatic 

x = MyObject.staticVar; // getstatic 

my0bj.instanceVar = x; // putfield 

x = my0bj.instanceVar; // getfield 

Object obj = my0bj; 

if (obj instanceof MyObject) { // instanceof 
myobj = (MyObject) obj; // checkcast 





上 面 提 到 的 指令 除 ldc 以 外 ， 都 属于 引用 类 指 
令 ， 在 ch06\instructions 目 录 下 创建 references 子 目录 
来 存放 引用 类 指令 。 首 先 实现 new 指 令 。 


6.6.1 new 指 令 





注意 ，new 指 令 专 门 用 来 创建 类 实例 。 数 组 由 
专门 的 指令 创建 ， 在 第 8 章 中 实现 数组 和 数组 相关 
指令 。 在 ch06\instructions\references 目 录 下 创建 
new.go 文 件 ， 在 其 中 实现 new 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/cho6/instructions/base" 
import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Create new object 

type NEW struct{ base.Index1i6Instruction } 





new 指 令 的 操作 数 是 一 个 uint16 索 引 ， 来 自 字 贡 
码 。 通 过 这 个 索引 ， 可 以 从 当前 类 的 运行 时 常量 池 
中 找到 一 个 类 符号 引用 。 解 析 这 个 类 符号 引用 ， 拿 
到 类 数据 ， 然 后 创建 对 象 ， 并 把 对 象 引用 推 入 栈 
顶 ，new 指 令 的 工作 就 完成 了 。Execute() 方法 的 


代码 如 下 : 





func (self *NEW) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool() 
classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 
class := classRef.ResolvedcClass() 
if class.IsIinterface() || class.IsAbstract() { 
panic("java.lang.InstantiationError") 


ref := class.NewObject() 
frame,OperandStack( ) .PushRef(ref ) 





因为 接口 和 抽象 类 都 不 能 实例 化 ， 所 以 如 果 解 
析 后 的 类 是 接口 或 抽象 类 ， 按 照 Java 虚 拟 机 规范 规 
定 ， 需 要 抛 出 InstantiationError 异 常 。 另 外 ， 如 果 解 
析 后 的 类 还 没有 初始 化 ， 则 需要 移 初 始 化 类 。 在 第 
7 章 实现 方法 调用 之 后 会 详细 讨论 类 的 初始 化 ， 这 
里 暂时 先 忽 略 。Class 结 构 体 的 NewObject() 方法 
如 下 〈 在 class.go 文 件 中 ) : 





func (self *Class) NewObject() *Object { 
return newObject(self) 


} 








这 里 只 是 调用 了 Object 结构 体 的 newObject“〈 ) 
方法 ， 代 码 如 下 (在 object.go 中 ): 


func newObject(class *Class) *Object { 
return &Object{ 
class: class, 
fields: newSlots(class.instanceSlotCount), 
} 
上 


新 创建 对 象 的 实例 变量 都 应 该 同好 初始 值 ， 不 

过 并 不 需要 做 额外 的 工作 ， 有 基体 原因 前 面 已 经 讨论 

过 ， 此 处 不 再 资 述 。new 指 令 实现 好 了 ， 下 面 看 看 
如 何人 存 取 关 的 静态 变量 。 








6.6.2 ”putstatic 和 getstatic 指 令 


在 references 目 录 下 创建 putstatic.go 文 件 ， 在 其 
中 实现 putstatic 指 令 ， 代 码 如 下 : 





package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Set static field in class 

type PUT_STATIC struct{ base.Index1i6Instruction } 


putstatic 指 令 给 类 的 某 个 静态 变量 赋值 ， 

要 两 个 操作 数 。 第 一 个 操作 数 是 uint16 索 引 ， 来 目 
字 市 码 。 这 个 索引 可 以 从 当前 类 的 运行 时 策 
闻 中 找到 一 个 字段 特写 引用 ， 解 析 这 个 符号 引用 就 
可 以 知道 要 给 类 的 哪个 静态 变量 赋值 。 第 二 个 操作 
数 是 要 赋 给 静态 变量 的 什 ， 从 操作 数 栈 中 弹出 。 


Execute 〈) 方法 稍微 有 些 复杂 ， 分 三 部 分 介绍 : 


func (self *PUT_STATIC) Execute(frame *rtda.Frame) { 
currentMethod := frame.Method ( ) 
currentClass := CurrentMethod .ClLass() 
cp := currentClass.ConstantPool() 
fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef.ResolvedField() 
class := field.Class() 





先 合 到 当前 方法 、 当 前 类 和 当前 种 量 池 ， 人 然后 
解析 字段 符号 引用 。 如 末 声 明 字 段 的 类 还 没有 人 说 初 
始 化 ， 则 需要 先 初始 化 该 类 ， 这 部 分 逻辑 将 在 第 7 


草 实 现 。 继 续 看 代码 : 





if !field.ISStatic() { 
panic("java.lang.IncompatibleClassChangeError") 


上 
if field,.IsFinal() { 
if currentClass != class || currentMethod.Name() != "<clini 
panic("java.lang.IllegalAccessError") 
} 
} 





如 果 解 术 后 的 字段 是 实例 字段 而 非 静 态 字 上 段 ， 
则 抛 出 IncompatibleClassChangeError 异 常 。 如 果 是 





final 字 段 ， 则 实际 操作 的 是 静态 常量 ， 只 能 在 类 初 


始 化 方法 中 给 它 赋 值 。 人 否则 ， 会 抛 出 
IllegalAccessError 寞 常 。 类 初始 化 方法 由 编译 旨 生 
成 ， 名 字 是 <clinit>， 上 其 体 请 看 第 7 革 。 继 续 看 代 


位: 





descriptor := field.Descriptor() 
SlotId := field.SlotId() 

Slots := class.StaticVars() 
stack := frame.OperandStack() 
Switch descriptor[0] { 


case 'Z', 'B', 'C', 'S', 'I': Slots.SetIint(slotId, stack.Po 
case 'F': slots.SetFloat(slotId, stack.PopFloat()) 

case 'J': slots.SetLong(slotId, stack.PopLong()) 

case 'D': slots.SetDouble(slotId, stack.PopDouble()) 

case 'L', '[': slots.SetRef(slotId, stack.PopRef()) 


3 





根据 字段 类 型 从 操作 数 栈 中 弹出 相应 的 值 ， 然 
后 赋 给 静态 变量 。 至 此 ，pnutstatic 指 令 就 解释 完毕 
了 。getstatic 指 令 和 putstatic 正 好 相反 ， 它 取出 类 的 
某 个 静态 变量 值 ， 然 后 推 入 栈 顶 。 在 references 目 录 
下 创建 getstatic.go 文 件 ， 在 其 中 实现 getstatic 指 令 ， 


代码 如 下 : 





package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Get static field from class 

type GET_STATIC struct{ base.Index1i6Instruction } 





getstatic 指 令 只 需要 一 个 操作 数 : uint16 利 量 池 


索引 ， 用 法 和 putstatic 一 样 ， 代 码 如 下 : 





func (self *GET_STATIC) Execute(frame *rtda.Frame) { 
cp := frame.Method().cClass().cCconstantPool() 
fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef.ResolvedField() 
class := field.Class() 
If !field.IsStatic() { 
panic("java.lang.IncompatibleClassChangeError") 


} 








如 果 解 析 后 的 字段 不 是 静态 字段 ， 也 要 抛 出 
IncompatibleClassChangeError 异 常 。 如 果 声 明 字 段 
的 类 还 没有 初始 化 好 ， 也 需要 先 初始 化 。getstatic 

只 是 读 取 静 态 变 量 的 值 ， 自 然 也 就 不 用 管 它 是 否 是 








final 了 。 继 续 看 剩 下 的 代码 : 





descriptor := field.Descriptor() 

SlotId := field.SlotId() 

Slots := class.StaticVars() 

stack := frame.OperandStack() 

switch descriptor[0] { 

case 'Z', 'B', 'C', 'S', 'I': stack.PushInt(slots.GetInt(sl 
case 'F': stack.PushFloat(slots.GetFloat(slotId)) 
case 'J': stack.PushLong(slots.GetLong(slotId)) 
case 'D': stack.PushDouble(slots.GetDouble(slotId)) 
case 'L', '[': stack.PushRef(slots.GetRef(slotId)) 
} 





根据 字段 类 型 ， 从 静态 变量 中 取出 相应 的 值 ， 
然后 推 入 操作 数 栈 项。 至 此 ，getstatic 指 令 也 解释 
完毕 了 。 下 面 介绍 如 何 存 取 对 象 的 实例 变量 。 


6.6.3 ”putfield 和 getfield 指 令 


在 references 目 录 下 创建 putfield.go 文 件 ， 在 其 
中 实现 putfield 指 令 ， 代 码 如 下 : 





package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Set field in object 

type PUT_FIELD struct{ base.Index1i6Instruction } 











putfield 指 令 给 实例 变量 赋值 ， 它 需要 三 个 操作 
数 。 前 两 个 操作 数 是 当量 池 索 引 和 变量 值 ， 用 法 和 
putstatic 一 样 。 第 三 个 操作 数 是 对 象 引 用 ， 从 操作 
数 栈 中 弹出 。 同 样 分 三 次 来 介绍 putfield 指 令 的 
Execute《〈) 方法 ， 第 一 部 分 代码 如 下 : 














func (self *PUT_FIELD) Execute(frame *rtda.Frame) { 
currentMethod := frame.Method() 
currentClass := currentMethod.class() 
cp := currentClass.ConstantPool() 


fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef.ResolvedField() 





基本 上 和 putstatic 一 样 ， 这 里 就 不 多 解释 了 。 
看 下 一 部 分 : 





if field.IsSstatic() { 
panic("java.lang.IncompatibleClasscCchangeError") 


If field.IsFinal() { 
if currentClass != field,Class() || currentMethod.Name() != 
panic("java.lang.IllegalAccessError") 








看 起 来 也 和 putstatic 差 不 多 ， 但 有 两 点 不 同 
(在 代码 中 已 经 加 粗 ) 。 第 一 ， 解 析 后 的 字段 必须 
是 实例 字段 ， 否 则 抛 出 
IncompatibleClassChangeError。 第 二 ， 如 果 是 final 
字段 ， 则 只 能 在 构造 函数 中 初始 化 ， 否 则 抛 出 
IllegalAccessError。 在 第 7 章 会 介绍 构造 函数 。 下 面 
看 剩 下 的 代码 : 





descriptor := field.Descriptor() 
slotId := field.SlotId() 
stack := frame.OperandStack() 
Switch descriptor[0] { 
case 有 'B', “Co 'S', TY 
val := stack.PopInt() 
ref := stack.PopRef() 
if ref == nil { 
panic("java.lang.NullPointerException") 


ref.Fields().SetIint(slotId, val) 
case 'F': ... 

case 
case 
case 


} 


王 口 也 
i 





先 根据 字段 类 型 从 操作 数 栈 中 弹出 相应 的 变量 
值 ， 然 后 弹出 对 象 引 用 。 如 果 引 用 是 null， 需 要 抛 
出 著名 的 空 指针 异常 (NullPointerException ) ， 否 
则 通过 引用 给 实例 变量 赋值 。 其 他 的 case 语 句 和 第 
一 个 大 同 小 异 ， 为 了 节约 篇 幅 ， 省 略 了 详细 代码 。 








putfield 指 令 解 释 完 毕 ， 下 面 来 看 getfield 指 令 。 
在 references 目 录 下 创建 getfield.go 文 件 ， 在 其 中 实 


现 getfield 指 令 ， 代 码 如 下 : 





package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Fetch field from object 

type GET_FIELD struct{ base.Index1i6Instruction } 





getfield 指 令 获 取 对 象 的 实例 变量 值 ， 然 后 推 入 
操作 数 栈 ， 它 需要 两 个 操作 数 。 第 一 个 操作 数 是 
uint16 索 引 ， 用 法 和 前 面 三 个 指令 一 样 。 第 二 个 操 
作 数 是 对 象 引 用 ， 用 法 和 putfield 一 样 。 下 面 看 看 
getfield 指 令 的 Execute 方 法 〈() ， 第 一 部 分 代码 如 
下 : 





func (self *GET_FIELD) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool() 
fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef.ResolvedField() 
If field.IsStatic() { 
panic("java.lang.IncompatibleClassChangeError") 


让 








stack := frame.Operandstack() 

ref := Stack.PopRef() 

if ref == nil { 
panic("java.lang.NullPointerException") 





弹出 对 象 引用 ， 如 果 是 null， 则 抛 出 
NullPointerException。 剩 下 的 代码 如 下 : 





descriptor := field.Descriptor() 

SlotId := field.SlotId() 

slots := ref.Fields() 

Switch descriptor[0] { 

case 'Z', 'B', 'C', 'S', 'I': stack.PushInt(slots.GetInt(sl 
case 'F': stack.PushFloat(slots.GetFloat(slotId)) 

case 'J': stack.PushLong(slots.GetLong(slotId)) 

case 'D': stack.PushDouble(slots.GetDouble(slotId)) 

case 'L', '[': stack.PushRef(slots.GetRef(slotId)) 


3 











根据 字段 类 型 ， 获 取 相 应 的 实例 变量 值 ， 然 后 
推 入 操作 数 栈 。 至 此 ，getfield 指 令 也 解释 完毕 了 。 


下 面 讨论 instanceof 和 checkcast 指 今 。 


6.6.4 instanceof 和 checkcast 指 令 


instanceof 指 令 判 断 对 象 是 否 是 示 个 类 的 实例 
(或 者 对 象 的 类 是 否 实现 了 菏 个 接口 ) ， 并 把 结 采 
推 入 操作 数 栈 。 在 references 目 录 下 创建 
instanceof.go 文 件 ， 在 其 中 实现 instanceof 指 令 ， 代 
人 码 如 下 : 


package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Determine if object is of given type 

type INSTANCE_ OF struct{ base.Index1i6Instruction } 


instanceof 指 令 需 要 两 个 操作 数 。 第 一 个 操作 数 
是 uint16 夫 引 ， 从 方法 的 字 节 人 码 中 获取 ， 通 过 这 个 
索引 可 以 从 当前 类 的 运行 时 常量 池 中 找到 一 个 类 符 
号 引用 。 第 二 个 操作 数 是 对 象 引用 ， 从 操作 数 栈 中 





弹出 。instanceof 指 令 的 Execute () 方法 如 下 : 





func (self *INSTANCE_OF) Execute(frame *rtda.Frame) { 
stack := frame.0perandStack( ) 
ref := Stack.PopRef() 
if ref == nil { 
Stack.PushInt(0) 
return 


cp := frame.Method().Class().ConstantPool() 
classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 
class := classRef.ResolvedClass() 
if ref.IsInstanceOof(class) { 
stack.PushIint(1) 
} else { 
stack.PushIint(0) 





先 弹 出 对 象 引 用 ， 如 果 是 null， 则 把 0 推 入 操作 
数 栈 。 用 Java 代 但 解释 就 是 ， 如 果 引 用 obj 是 null 的 
话 ， 不 党 ClassYYY 是 哪 种 类 型 ， 下 面 这 条 这 判断 都 


是 false: 





if (obj instanceof ClassYYY) {...} 








如 果 对 象 引 用 不 是 null， 则 解析 类 符号 引用 ， 





判断 对 象 是 否 是 类 的 实例 ， 然 后 把 判断 结果 推 入 操 
作 数 栈 。Java 虚 拟 机 规范 给 出 了 具体 的 判断 步 又 ， 
我 们 在 Object 结 构 体 的 IsInstanceOf() 方法 中 实 
现 ， 稍 后 给 出 代码 。 下 面 来 看 checkcast 指 令 。 在 
references 目 录 下 创建 checkcast.go 文 件 ， 在 其 中 实现 
checkcast 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Check whether object is of given type 

type CHECK_CAST struct{ base.Index1i6Instruction } 


checkcast 指 令 和 instanceof 指 令 很 像 ， 区 别 在 
于 : instanceof 指 令 会 改变 操作 数 栈 (弹出 对 象 引 
用 ， 推 入 判断 结果 ) ; checkcast 则 不 改变 操作 数 栈 
(如 果 判 断 失 败 ， 直 接 抛 出 ClassCastException 异 
种 ) 。checkcast 指 令 的 Execute 〈) 方法 如 下 : 


func (self *CHECK_CAST) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
ref := stack.PopRef() 
stack.PushRef (ref) 
if ref == nil { 
return 


cp := frame.Method().Cclass().cCconstantPool() 

classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 

class := classRef.ResolvedClass() 

If !ref.IsInstanceOof(class) { 
panic("java.lang.ClassCastException") 





先 从 操作 数 栈 中 弹出 对 象 引 用 ， 再 推 回 去 ， 这 
样 就 不 会 改变 操作 数 栈 的 状态 。 如 果 引 用 是 null， 
则 指令 执行 结束 。 也 就 是 说 ，null 引 用 可 以 转换 成 
任何 类 型 ， 否 则 解析 类 符号 引用 ， 判 断 对 象 是 否 是 
类 的 实例 。 如 果 是 的 话 ， 指 令 执行 结束 ， 否 则 抛 出 
ClassCastException。instanceof 和 checkcast 指 令 一 般 


部 是 配合 使 用 的 ， 像 下 面 的 Java 代 码 这 样 : 





if (xxx instanceof ClassYYY) { 
yyy = (ClassYYY) xxx; 
// Use yyy 

} 


| | 


Object 结构 体 的 IsInstanceOf 〈) 方法 的 代码 如 
下 《在 object.go 文 件 中 ) : 


func (self *Object) IsInstanceof(class *Class) bool { 
return class.isAssignableFrom(self.class) 


} 


真正 的 逻辑 在 Class 结 构 体 的 
isAssignableFrom 〈) 方法 中 ， 这 个 方法 和 微 有 些 复 
杂 ， 为 了 避免 class.go 文 件 变 得 过 长 ， 把 它 写 在 男 一 
个 文件 中 。 在 ch06Ntda\heap 目 录 下 创建 
class_hierarchy.go 文 件 ， 在 其 中 定义 
isAssignableFrom 〈) 方法 ， 代 码 如 下 : 


func (self *Class) isAssignableFrom(other *Class) bool { 
s, t := other, self 
if s == tH{ 
return true 


} 
if !t,ISInterface() { 
return s.isSubClassOof(t) 
} else { 
return s.isImplements(t) 
} 
} 


也 就 是 说 ， 在 三 种 情况 下 ，S 类 型 的 引用 值 可 
以 赋值 给 T 类 型 : S 和 了 T 是 同一 类 型 ，T 是 类 且 S 古 T 
的 子 类 ; 或 者 T 是 接口 且 S 实 现 了 T 接 口 。 这 是 简化 
版 的 判断 逻辑 ， 因 为 还 没有 实现 数组 ， 第 8 草 讨 论 
数组 时 会 继续 完善 这 个 方法 。 继 续 编 辑 
class_hierarchy.go 文 件 ， 在 其 中 实现 
isSubClassOf 〈) 方法 ， 代 码 如 下 : 


func (self *Class) 1ISsSubClassof(other *Class) bool { 
for c := self.superClass; c != nil; c = c.superClass { 
if c == other { 
return true 


return false 


} 








判断 S 是 否 是 T 的 子 类 ， 实 际 上 也 整 是 判断 T 是 
侍 古 S 的 (直接 或 间接， 超 类 。 继 续 编 辑 
class_hierarchy.go 文 件 ， 在 其 中 实现 


isImplements〈) 方法 ， 代 人 码 如 下 : 





func (self *Class) isImplements(iface *Class) bool { 
for c := self; c != nil; c = c.superClass { 
for _, i := range c.interfaces { 
if i == iface || i.isSubInterfaceOof(iface) { 
return true 
} 
} 
} 


return false 








判断 S 是 否 实现 了 T 接 口 ， 就 看 S 或 的 (直接 
或 间接 ) 超 类 是 否 实现 了 某 个 接口 T'，T' 要 么 是 TT， 
要 么 是 T 的 子 接口 。isSubInterfaceOf() 方法 也 在 
class_hierarchy.go 文 件 中 ， 代 码 如 下 : 





func (self *Class) isSubInterfaceOof(iface *Class) bool { 
for _, superIinterface := range self.interfaces { 
If SuperInterface == iface || superIinterface.isSubInterf 
return true 


} 


return false 


isSubInterfaceOf () 方法 和 isSubClassOf () 
方法 类 似 ， 但 是 用 到 了 递归 ， 这 里 不 多 解释 了 。 到 
此 为 止 ，instanceof 和 checkcast 指 令 就 介绍 完毕 了 ， 


下 面 来 看 ldc 指 令 。 


6.6.5 1dc 指 令 











ldc 系 列 指 令 从 运行 时 常量 池 中 加 载 常 量 值 ， 并 
把 它 推 入 操作 数 栈 。ldc 系 列 指令 属于 常量 类 指令 ， 
共 3 条 。 其 中 ldc 和 1ldc_w 指 令 用 于 加 载 int、float 和 字 
从 串 和 常量，java.lang.Class 实 例 或 者 MethodType 和 
MethodHandle 实 例 。1ldc2_w 指 令 用 于 加 载 long 和 
double 常 量 。ldc 和 ldc_w 指 令 的 区 别 仅 在 于 操作 数 
的 宽度 。 








本 章 只 处 理 int、float、long 和 double 和 常量 。 第 8 
草 实 现 数组 和 字符 串 之 后 ， 会 进一步 完善 dc 指令 ， 
文 持 字 符 串 常量 的 加 载 。 第 9 章 还 会 继续 完善 1dc 指 
令 ， 文 持 Class 实 例 的 加 载 。 本 书 不 讨论 
MethodType 和 MethodHandle， 感 兴趣 的 读者 请 参考 








Java 虚 拟 机 规范 的 相关 章节 。 


在 ch06\instructions\constants 目 录 下 创建 ldc.go 
文件 ， 在 其 中 定义 ldc、ldc_w 和 1]ldc_2w 指 令 ， 代 码 
如 下 : 





package constants 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

type LDC struct{ base.Index8Instruction } 
type LDC Ww struct{ base.Index16Instruction } 
type LDC2 W struct{ base.Index1i6Instruction } 





ldc 和 ]dc_w 指 令 的 逻辑 完全 一 样 ， 在 _ldc () 
函数 中 实现 ， 代 人 码 如 下 : 





func (self *LDC) Execute(frame *rtda.Frame) { 
_ldc(frame, self.Index) 


} 

func (self *LDC W) Execute(frame *rtda.Frame) { 
_ldc(frame, self.Index) 

} 





_ldc() 函数 的 代码 如 下 : 


func _ldc(frame *rtda.Frame, index uint) { 
stack := frame.OperandSstack() 
cp := frame.Method().cClass().cCconstantPool() 
c := cp.GetConstant(index) 
Switch c.(type) { 
case int32: stack.PushIint(c. (int32)) 
case float32: stack.PushFloat(c. (float32)) 
// case String: 在 第 


8 章 实现 


// case *heap.ClassRef: 在 第 


9 章 实 现 


default: panic("todo: ldc!") 
} 








先 从 当前 类 的 运行 时 常量 池 中 取出 和 常量。 如 果 
是 int 或 float 津 量 ， 则 提取 出 常量 值 ， 则 推 入 操作 数 
栈 。 其 他 情况 还 无 法 处 理 ， 和 暂时 调用 panic () 函数 
终止 程序 执行 。ldc_2w 指 令 的 Execute 〈() 方法 单独 
实现 ， 代 码 如 下 : 








func (self *LDC2 W) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
cp := frame.Method(),Class().ConstantPool() 
c := cp.GetConstant(self.Index) 
Switch c.(type) { 
case int64: stack.PushLong(c. (int64)) 
case float64: stack.PushDouble(c. (float64)) 
default: panic("java.lang.ClassFormatError") 





代码 比较 简单 ， 不 多 解释 ， 这 里 重点 说 一 下 
Frame 结 构 体 的 Method () 方法 。 为 了 通过 frame 变 

拿 到 当前 类 的 运行 时 第 量 池 ， 给 Frame 结 构 体 添 
加 了 method 字 段 ， 代 人 码 如 下 : 





type Frame struct { 


lower *Frame 
localVars LocalVars 
operandStack *OperandStack 
thread *Thread 
method *heap .Method 
neXxtPC int 





Method () 是 Getter 方 法 ， 束 不 给 出 代码 了 。 
newFrame () 水 数 有 相应 变化 ， 代 码 如 下 : 





func newFrame(thread *Thread, method *heap.Method) *Frame { 
return &Framet 


thread: thread, 

method: method, 

localVars: newLocalVars(method.MaxLocals( )), 
operandStack : newoOperandStack(method ,MaxStack() )， 








到 此 ， 类 和 对 象 相关 的 10 条 指令 都 实现 好 了 。 
最 后 还 需要 修改 ch06\instructions\factory.go 文 件 ， 在 
其 中 添加 这 些 指令 的 case 语 句 。 有 具体 改动 也 比较 简 


了 


单 ， 这 里 惑 不 给 出 代码 了 。 


6.7 ”测试 本 章 代码 


打开 ch06\main.go 文 件 ， 修 改 import 语 句 ， 代 码 
如 下 : 





package main 

import "fmt" 

import "strings" 

import "jvmgo/cho6/classpath" 
import "jvmgo/cho6/rtda/heap" 





main () 也 数 不 变 ， 删 挥 其 他 函数 ， 然 后 修改 
startJVM () 函数 ， 代 码 如 下 : 





func startJVM(cmd *Cmd) £ 


cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
classLoader := heap.NewClassLoader(cp) 
className := strings.Replace(cmd.class, ".", "/", -1) 
mainClass := classLoader.LoadClass(className) 
mainMethod := mainClass.GetMainMethod ( ) 
if mainMethod != nil { 

interpret(mainMethod) 
} else { 

fmt.Printf("Main method not found in class %s\n", cmd.cl 
} 


5 


先 创建 ClassLoader 实 例 ， 然 后 用 它 来 加 载 主 
类 ， 最 后 执行 主 类 的 main 〈) 方法 。Class 结 构 体 的 
GetMainMethod 〈) 方法 如 下 《在 
ch06\rtda\heap\class.go 文 件 中 ) : 





func (self *Class) GetMainMethod() *Method { 
return self.getStaticMethod("main", "([Ljava/lang/String;)yVv 
} 





它 只 是 调用 了 getStaticMethod 〈) 方法 而 已 ， 
代码 如 下 : 





func (self *Class) getStaticMethod(name, descriptor string) *M 
for _, method := range self.methods { 
If method.IsStatic() && 
method.name == name && method.descriptor == descripto 
return method 


: 


return nil 


} 





接 下 来 编辑 ch06\interpreter.go 文 件 ， 修 改 


import 语 句 ， 代 人 码 如 下 : 





package main 

import "fmt" 

import "jvmgo/cho6/instructions" 
import "jvmgo/cho6/instructions/base" 
import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 





其 他 函数 不 变 ， 只 修改 interpret () 函数 ， 代 
人 码 如 下 : 





func interpret(method *heap ,Method ) { 
thread := rtda.NewThread ( ) 
frame := thread.NewFrame(method ) 
thread.PushFrame(frame) 
defer catchErr(frame ) 
Joop(thread，method. code()) 





Thread 结 构 体 的 NewFrame 〈) 方法 如 下 (在 
ch06\rtda\thread.go 文 件 中 ) : 





func (self *Thread) NewFrame(method *heap.Method) *Frame { 
return newFrame(self, method) 


二 





在 编译 本 章 代 码 之 前 ， 还 需要 添加 两 个 hack。 
因为 对 象 是 需要 初始 化 的 ， 所 以 每 个 类 都 至 少 有 一 
个 构造 函数 。 即 使 用 户 上 自己 不 定义 ， 编 译 器 也 会 自 
动 生 成 一 个 默认 构造 函数 。 在 创建 类 实例 时 ， 编 译 
器 会 在 new 指 令 的 后 面 加 入 invokespecial 指 令 来 调用 
构造 函数 初始 化 对 象 。 要 到 第 7 章 才 会 实现 
invokespecial 指 令 ， 为 了 测试 putfield 和 getfield 等 指 

这 里 先 给 它 一 个 空 的 实现 。 在 
ch06\instructions\references 目 录 下 创建 
invokespecial.go 文 件 ， 把 下 面 的 代码 复制 进去 : 














package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

type INVOKE_SPECIAL struct{ base.Index1i6Instruction } 

// hack! 

func (self *INVOKE_ SPECIAL) Execute(frame *rtda.Frame) { 
frame.OperandSstack().PopRef() 

} 


第 5 草 通 过 打印 局 部 变量 表 和 操作 数 栈 的 方式 


观察 计算 结果 ， 
hack 来 解决 这 


这 样 很 不 方便 。 这 里 用 另外 一 个 


个 问题 。 在 ch06\instructions\references 


目录 下 创建 invokevirtual.go 文 件 ， 把 下 面 的 代码 复 
制 进 去 : 





packag 
import 
import 
import 
import 


// hac 


e references 
"fmt ni 


"jvmgo/cho6/instructions/base" 
"jvmgo/cho6/rtda" 

"jvmgo/cho6/rtda/heap" 

// Invoke instance method; dispatch based on class 
type INVOKE_VIRTUAL struct{ base.Index1i6Instruction } 


k! 


func (self *INVOKE_ VIRTUAL) Execute(frame *rtda.Frame) { 

:= frame.Method().Class().ConstantPool() 

hodRef := cp.GetConstant(self.Index).(*heap.MethodRef) 
If methodRef .Name() == "printilin™" { 

stack := frame.OperandStack() 


cp 
met 


Switch methodRef. 
case "(Z)V": fmt. 
case "(C)V": fmt. 
case "(B)V": fmt. 
case "(S)V": fmt. 
case "(I)V": fmt. 
case "(J)V": fmt. 
case "(F)V": fmt. 
case "(D)V": fmt. 


Descriptor() { 

Printf("%v\n", stack.PopInt() != 0) 
Printf("%c\n", stack.PopInt()) 
Printf("%v\n", stack.PopInt()) 
Printf("%v\n", stack.PopInt()) 
Printf("%v\n", stack.PopInt()) 
Printf("%v\n", stack.PopLong()) 
Printf("%v\n", stack.PopFloat()) 
Printf("%v\n", stack.PopDouble()) 


default: panic("println: " + methodRef.Descriptor()) 


} 
stack.PopRef() 


至 于 这 两 个 hack 为 什么 可 以 起 作用 ， 请 阅读 第 
7 章 ， 在 那里 会 讨论 方法 调用 和 返回 。 有 了 上 面 的 
hack， 可 以 修改 6.6 小 节 开 头 给 出 的 Java 例 子 ， 添 加 
输出 语句 ， 代 码 如 下 : 





package jvmgo.book.cho6; 
public class MyObject { 
public static int staticVar; 
public int instanceVar ; 
public static void main(String[] args) { 


int x = 32768 // ldc 

MyObject my0bj]j = new MyObject(); // new 

MyObject.staticVar = x; // putstatic 

x = MyObject.staticVar; // getstatic 

my0bj.instanceVar = x; // putfield 

x = my0bj.instanceVar; // getfield 

Object obj = my0bj; 

if (obj instanceof MyObject) { // instanceof 
myobj = (MyObject) obj; // checkcast 


System.out.println(my0bj.instanceVar); 





打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 代 
码 : 





go install jvmgo\ch06 





命令 执行 完毕 后 ，D: \goNvworkspace\bin 目录 会 
出 现 ch06.exe 文 件 。 用 javac 编 译 MyObject 类 ， 然 后 
用 ch06.exe 执 行 MyObject 程 序 ， 结 果 如 图 6-3 和 图 6- 


4 所 示 。 


D:NgoVworkspacevbin>ch06. exe -Xire “C:\Program Files\Java\irel.8.0 66” jvmgo. bool 
k. ch06. NyOb ject 

[Loaded java/lang/Obijiect from C:\Program Files\Java\irel. 8.0 66\1ib\rt. jar] 
[Loaded jvmeo/book/ch06 /NyObiect from D:\go\workspace\bin] 

pc: 0 inst:*constants. LDC &{{2}} 

pc: 2 inst: 

pc: 3 inst: 

pc: 6 inst:*stack. DUP &{8] 

pce: inst :#references. INVOKE_ SPECIAL &{{4}} 

pe:10 inst:*stores. ASTORE 2 &{@) 


本 命令 提示 符 
pc:39 inst:*references. CHECK_CAST &{1{3}} 
pc:42 inst:*stores. ASTORE 2 &{0} 
pc:43 inst:*references. GET STATIC &{{7}) 
[Loaded java/lang/System from C:\Program Files\Tava\irel. 8.0 66\1lib\rt. jar] 
pc:46 inst:*loads. ALOAD 2 &{0} 
pe:d? inst:*references. GET_FIELD &{{6}} 
pc:50 inst:*references. INVOKE VIRTUAL &{{8}} 
32768 





D:\go\workspace \bin> 


图 6-4 MyObject 程 序 执行 结果 (2) 


6.8 ”本 章 小 结 


本 章 实现 了 方法 区 、 运 行 时 常量 池 、 类 和 对 象 
结构 体 、 一 个 简单 的 类 加 载 器 ， 以 及 ldc 和 部 分 引用 
类 指令 。 下 一 章 将 讨论 方法 调用 和 返回 ， 到 时 就 可 


以 执行 更 加 复杂 的 方法 了 。 


第 7 章 ”方法 调用 和 返回 


第 4 章 实现 了 Java 虚 拟 机 栈 、 帧 等 运行 时 数据 
区 ， 为 方法 的 执行 打 好 了 基础 。 第 5 章 实 现 了 一 个 
简单 的 解释 器 和 150 多 条 指令 ， 已 经 可 以 执行 单个 
方法 。 第 6 章 实现 了 方法 区 ， 为 方法 调用 扫 清 了 障 
碍 。 本 草 将 实现 方法 调用 和 返回 ， 在 此 基础 上 ,还 
会 讨论 类 和 对 象 的 初始 化 。 


开始 本 章 之 前 ， 还 是 先 把 目录 结构 准备 好 。 复 
制 ch06 目 录 ， 改 名 为 chn07。 修 改 main.go 等 文件 ， 把 
impott 语 多 中 的 ch06 全 都 替换 成 chn07。 本 章 对 目录 
结构 没有 太 大 的 调整 


7.1 方法 调用 概述 





从 调用 的 角度 来 看 ， 方 法 可 以 分 为 两 类 : 静态 
方法 (或 者 类 方法 ) 和 实例 方 读 。 静 态 方法 通过 关 
来 调用 ， 实 例 方 法 则 通过 对 象 引用 来 调用 。 静 态 方 
法 是 静态 绑 定 的 ， 也 束 古 说 ， 最 终 调 用 的 古 哪个 方 
法 在 编译 期 融 已 经 确定 。 实 例 方法 则 文 持 动态 绑 
定 ， 最 终 要 调用 哪个 方法 可 能 要 推迟 到 运行 期 才能 


知道 ， 本 章 将 详细 讨论 这 一 点 。 














从 实现 的 角度 来 看 ， 方 法 可 以 分 为 三 类 : 没有 
实现 (也 就 是 抽象 方法 ) 、 用 Java 语 言 (或 者 JVM 
上 的 其 他 语言 ， 如 Groovy 和 和 Scala 等 ) 实现 和 用 本 地 
语言 (如 C 或 者 C++) 实现 。 静 态 方法 和 抽象 方法 
是 互 斥 的。 在 Java 8 之 前 ， 接 口 只 能 包含 抽象 方 





法 。 为 了 实现 Lambda 表 达 式 ，Java 8 放宽 了 这 一 限 
制 ， 在 接口 中 也 可 以 定义 静态 方法 和 默认 方法 。 本 
章 不 考虑 接口 的 静态 方法 和 默认 方法 ， 感 兴趣 的 读 
者 请 阅读 Java 虚 拟 机 规范 相关 章 市 。 在 本 书 中 ， 我 
们 把 Java 等 语言 实现 的 方法 叫 作 Java 方 法 。 本 章 只 
讨论 Java 方 法 的 调用 ， 本 地 方法 调用 将 在 第 9 章 中 介 


绍 。 














在 Java 7 之 前 ，Java 虚 拟 机 规范 一 共 提 供 了 4 条 
方法 调用 指令 。 其 中 invokestatic 指 令 用 来 调用 静态 
方法 。invokespecial 指 令 用 来 调用 无 须 动 态 绑 定 的 
实例 方法 ， 包 括 构造 函数 、 私 有 方法 和 通过 super 关 
键 字 调用 的 超 类 方法 。 剩 下 的 情况 则 属于 动态 绑 
定 。 如 果 是 针对 接口 类 型 的 引用 调用 方法 ， 就 使 用 


invokeinterface 指 令 ， 人 否则 使 用 invokevirtual 指 令 。 














本 章 将 实现 这 4 条 指令 。 





为 了 更 好 地 文 持 动 态 类 型 语言 ，Java 7 增加 了 
一 条 方法 调用 指令 invokedynamic。 本 草 不 讨论 这 条 
指令 ， 感 兴趣 的 读者 请 阅读 Java 虚 拟 机 规范 相关 章 
节 。 在 深入 讨论 各 条 方法 调用 指令 的 细节 之 前 ， 先 
简单 了 解 Java 虚 拟 机 是 如 何 调用 方法 的 。 








首先 ， 方 法 调用 指令 需要 n+1 个 操作 数 ， 其 中 
第 1 个 操作 数 是 uint16 索 引 ， 在 字 市 码 中 紧 跟 在 指令 
操作 码 的 后 面 。 通 过 这 个 索引 ， 可 以 从 当前 类 的 运 
行 时 常量 池 中 找到 一 个 方法 符 写 引用 ， 解 析 这 个 符 
号 引用 就 可 以 得 到 一 个 方法 。 注 意 ， 这 个 方法 并 不 
一 定 就 是 最 终 要 调用 的 那个 方法 ， 所 以 可 能 还 需要 
一 个 查找 过 程 才能 找到 最 终 要 调用 的 方法 。 剩 下 的 
n 个 操作 数 是 要 传递 给 被 调用 方法 的 参数 ， 从 操作 








数 栈 中 弹出 。 将 在 7.2 小 节 讨 论 方法 符号 引用 的 解 
析 。 


如 果 要 执行 的 是 Java 方 法 而 非 本 地 方法 ) ， 
步 是 给 这 个 方法 创建 一 个 新 的 帧 ， 并 把 它 推 到 
Java 虚 拟 机 栈 顶 。 传 递 参数 之 后 ， 痢 的 方法 咒 可 以 
开始 执行 了。 将 在 7.3 小 市 讨论 参数 传 违 ， 本 地 方法 
调用 则 推迟 到 第 9 草 再 讨论 。 下 面 是 一 段 伪 代 码 ， 
用 于 说 明 Java 方 法 的 调用 过 程 。 





func (self *INVOKE_XXX) Execute(frame *rtda.Frame) { 
cp := frame.Method().Cclass().constantPool() 
methodRef := cp.GetConstant(self.Index).(*heap.MethodrRef) 
resolved := resolveMethodRef(methodRef ) 
checkResolvedMethod(resolved) 
toBeInvoked := findMethodToInvoke(methodrRef) 
newFrame := frame.Thread().NewFrame(toBeInvoked) 
frame.Thread().PushFrame(newFrame) 
passArgs(frame, newFrame) 





方法 的 最 后 一 条 指令 是 茶 个 返回 指令 ， 这 个 指 


令 负责 把 方法 的 返回 值 推 入 前 一 帧 的 操作 数 栈 顶 ， 
然后 把 当前 帧 从 Java 虚 拟 机 栈 中 弹出 。 将 在 7.4 小 节 
讨论 返回 指令 ， 在 7.5 小 节 讨论 方法 调用 指令 。 


7.2 ”解析 方法 符 写 引用 


非 接口 方法 符号 引用 和 接口 方法 符号 引用 的 解 
析 规 则 是 不 同 的 ， 因 此 本 章 分 开 讨 论 这 两 种 符号 引 
用 。Java 虚 拟 机 规范 的 5.4.3.3 节 和 5.4.3.4 节 详细 描述 
了 这 两 种 符号 引用 的 解析 规则 。 由 于 本 书 不 讨论 接 
口 的 静态 方法 和 默认 方法 ， 所 以 在 本 小 节 中 ， 主 要 
参考 Java 虚 拟 机 规范 第 7 版 编写 代码 ， 请 读者 注意 这 
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7.2.1 非 接口 方法 符号 引用 


打开 ch07\rtda\heap\cp_methodref.go 文 件 ， 在 其 
中 实现 ResolvedMethod () 方法 ， 代 码 如 下 : 





func (self *MethodRef) ResolvedMethod() *Method { 
If self.method == nil { 
self.resolveMethodRef() 
} 


return self.method 


| 





如 果 还 没有 解析 过 符号 引用 ， 调 用 
resolveMethodRef () 方法 进行 解析 ， 人 否则 直接 返 
回 方法 指针 。resolveMethodRef () 方法 的 代码 如 
下 : 





func (self *MethodRef) resolveMethodRef() { 
d := self.cp.class 
c := self.ResolvedClass() 
if c.IsIinterface() { 
panic("java.lang.IncompatibleClassChangeError") 


method := lookupMethod(c, self.name, self.descriptor) 


if method == nil { 
panic("java.lang.NoSuchMethodError") 


} 
If Imethod.isAccessibleTo(d) { 
panic("java.lang.IllegalAccessError") 


self.method = method 


如 末 类 DD 想 通 过 方法 符号 引用 访问 类 C 的 菏 个 
方法 ， 先 要 解析 符号 引用 得 到 类 C。 如 果 C 是 接 
口 ， 则 抛 出 IncompatibleClassChangeError 异 销 ， 人 否 
则 根据 方法 名 和 摘 述 符 碍 找 方法 。 如 有 果 找 不 到 对 应 
的 方法 ， 则 抛 出 NoSuchMethodError 异 常 ， 否 则 检 
租 类 D 是 侣 有 权限 访问 该 方法 。 如 采 没 有 ， 则 抛 出 
IllegalAccessError 异 常 。isAccessibleTo() 方法 是 
在 ClassMember 结 构 体 中 定义 的 ， 在 第 6 章 就 已 经 实 
现 了 。 下 面 看 一 下 lookupMethod () 函数 ， 其 代码 
nh: 














func lookupMethod(class *Class, name, descriptor string) *Meth 
method := LookupMethodIinClass(class, name, descriptor) 


if method == nil { 
method = lookupMethodInIinterfaces(class.interfaces, name 


return method 


} 


先 从 C 的 继承 层次 中 找 ， 如 末 找 不 到 ， 就 去 C 
的 接口 中 找 。LookupMethodInClass () 函数 在 很 多 
地 方 都 要 用 到 ， 所 以 在 
ch07\rtda\heap\method_lookup.go 文 件 中 实现 它 ， 代 
人 码 如 下 : 


func LookupMethodInCclass(class *Class, name, descriptor string 


for c := class; Cc != Nil; c = c.superClass { 
for _, method := range c.methods { 
If method.name == name && method.descriptor == descri 


return method 


} 
} 


return nil 


} 


lookupMethodInInterfaces () 函数 也 在 
method_lookup.go 文 件 中 ， 代 码 如 下 : 


func lookupMethodInInterfaces(ifaces [|]*Class, name, descriptc 


for _, iface := range ifaces { 
for _, method := range iface.methods { 
If method.name == name && method.descriptor == descri 
return method 
} 
} 
method := lookupMethodInIinterfaces(iface.interfaces, nan 


If method != nil { 
return method 
} 
} 
return nil 


} 





至 此 ， 非 接口 方法 符 写 引用 的 解析 残 介 绍 完 
了 ， 下 面 介绍 接口 方法 符号 引用 如 何 解析 。 


7.2.2 ”接口 方法 符号 引用 


打开 ch07Ntda\heap\cp_interface_methodref.go 文 
件 ， 在 其 中 实现 ResolvedInterfaceMethod () 方 
法 ， 代 码 如 下 : 





func (self *InterfaceMethodRef) ResolvedInterfaceMethod( ) *Met 
If self.method == nil { 
self. resolveInterfaceMethodrRef() 
} 


return self.method 


} 





上 面 的 代码 和 ResolvedMethod () 方法 大 同 小 
异 ， 不 多 解释 。 下 面 来 看 resolveInterface- 
MethodRef 〈) 方法 ， 代 码 如 下 : 





func (self *InterfaceMethodRef ) resolveInterfaceMethodRef() { 
d := Self,cp.class 
c := self.ResolvedClass() 
if Ic.IsIinterface() { 
panic("java.lang.IncompatibleClassChangeError") 


method := lookupInterfaceMethod(c, self.name, self.descript 


if method == nil { 
panic("java.lang.NoSuchMethodError") 


} 
If Imethod.isAccessibleTo(d) { 
panic("java.lang.IllegalAccessError") 


self.method = method 





上 面 的 代码 和 resolveMethodRef () 方法 也 产 
不 多 ， 但 有 两 处 兰 别 ， 已 经 用 粗 体 显示 。 下 面 来 看 
lookupInterfaceMethod () 函数 ， 代 码 如 下 : 








func lookupInterfaceMethod(iface *Class, name, descriptor stri 
for _, method := range iface.methods { 
If method.name == name && method.descriptor == descripto 
return method 


return lookupMethodIinIinterfaces(iface.interfaces, name, des 


} 





如 果 能 在 接口 中 找到 方法 ， 就 返回 找到 的 方 
法 ， 和 否则 调用 lookupMethodInInterfaces () 函数 在 
超 接口 中 寻找 。lookupMethodInInterfaces () 函数 
己 经 在 前 一 小 节 介 绍 。 至 此 ， 接 口 方法 符号 引用 的 


解析 也 介绍 完毕 了 ， 下 面 讨论 如 何 给 方法 传递 参 
数 。 


7.3 “方法 调用 和 参数 传递 


在 定位 到 需要 调用 的 方法 之 后 ，Java 虚 拟 机 要 
给 这 个 方法 创建 一 个 新 的 帧 并 把 它 推 入 Java 虚 拟 机 
栈 顶 ， 然 后 传递 参数 。 逻辑 对 于 本 章 要 实现 的 
4 条 方法 调用 指令 来 说 基本 上 相同 ， 为 了 避免 重复 
代码 ， 在 单独 的 文件 中 实现 这 个 多 辑 。 在 
ch07instructions\base 目 录 下 创建 








method_invoke_logic.go 文 件 ， 在 其 中 实现 
InvokeMethod () 函数 ， 代 人 码 如 下 : 


func InvokeMethod(invokerFrame *rtda.Frame, method *heap.Metho 

thread := invokerFrame.Thread() 

newFrame := thread.NewFrame(method ) 

thread.PushFrame(newFrame ) 

argSlotSlot := int(method.ArgSlotCount()) 

If argSlotSlot >0{ 

for i := argSlotSlot - 1; i >= 0; i-- { 

Slot := invokerFrame.OperandStack().PopSlot() 
newFrame.LocalVars().SetSlot(uint(i), slot) 


函数 的 前 三 行 代码 创建 新 的 帧 并 推 入 Java 虚 拟 
机 栈 ， 剩 下 的 代码 传递 参数 。 重 点 讨论 参数 传递 。 
首先 ， 要 确定 方法 的 参数 在 局 部 变量 表 中 占用 多 少 
位 置 。 注 意 ， 这 个 数量 并 不 一 定 等 于 从 Java 代 码 中 
看 到 的 参数 个 数 ， 原 因 有 两 个 。 第 一 ，long 和 
double 类 型 的 参数 要 占用 两 个 位 置 。 第 二 ， 对 于 实 
例 方 法 ，Java 编 译 器 会 在 参数 列表 的 前 面 添加 一 个 
参数 ， 这 个 隐藏 的 参数 就 是 this 引 用 。 假 设 实际 的 
参数 占据 n 个 位 置 ， 依 次 把 这 n 个 变量 从 调用 者 的 操 
作 数 栈 中 弹出 ， 放 进 被 调用 方法 的 局 部 变量 表 中 ， 
参数 传递 就 完成 了 。 














注意 ， 在 代码 中 ， 并 没有 对 long 和 double 类 型 
做 特别 处 理 。 因 为 操作 的 是 Slot 结构 体 ， 所 以 这 是 
没 问 题 的 。LocalVars 结 构 体 的 SetSlot () 方法 是 新 


增 的 ， 代 码 如 下 : 


func (self LocalVars) SetSlot(index uint, slot Slot) { 
self[index] = slot 





如 果 忽 略 long 和 double 类 型 参数 ， 则 静态 方法 
的 参数 传递 过 程 如 图 7-1 所 示 。 


Invoker Frame New Frame 
Operand Stack Local Vars 
arg3 Ee 
arg2 ] Sa 
argl | var2 
| varl 
Re var0 


图 7-1 静态 方法 参数 传递 示意 图 


实例 方法 的 参数 传递 过 程 如 图 7-2 所 示 。 


Invoker Frame New Frame 


Operand Stack Local Vars 
arg3 画 本 
arg2 var3 
argl 本 由 NE var2 
objref -上 | 本 > varl 
EE s,s 


图 7-2 ”实例 方法 参数 传递 示意 图 


那么 那个 ArgSlotCount〈() 方法 返回 了 什么 


呢 ? 打 开 ch07\rtda\heap\method.go 文 件 ， 修 改 
Method 结 构 体 ， 给 它 添 加 argSlotCount 字 段 ， 代 人 码 


如 下 : 





type Method struct { 
ClassMember 
maxStack uint 
maxLocals uint 
code [jbyte 
argSlotCount uint 


} 


ArgSlotCount () 只 是 个 Getter 方 法 而 已 ， 代 码 
如 下 : 





func (self *Method) ArgSlotCount() uint { 
return self.argSlotCount 
} 





newMethods () 方法 也 需要 修改 ， 在 其 中 计算 
方法 的 argSlotCount， 代 码 如 下 : 





func newMethods(class *Class, cfMethods [1]*classfile.MemberInf 

methods := make([]*Method, len(cfMethods)) 

for i, cfMethod := range cfMethods { 
methods[i] = &Method{} 
methods[il].class = class 
methods[i].copyMemberInfo(cfMethod) 
methods[i].copyAttributes(cfMethod) 
methods[i].calcArgSlotCount() 

} 


return methods 





下 面 是 calcArgSlotCount 〈) 方法 的 代码 。 





func (self *Method) calcArgSlotCount() { 
parsedDescriptor := parseMethodDescriptor(self.descriptor) 
for _, paramType := range parsedDescriptor.parameterTypes { 
self.argSlotCount++ 


if paramType == "J" || paramType == "D" { 
self.argSlotCount++ 
} 
} 
If !self.IsStatic() { 
self.argSlotCount++ 


了 
} 


parseMethodDescriptor () 函数 分 解 方法 描述 


符 ， 返 回 一 个 MethodDescriptor 结 构 体 实例 。 这 个 





结构 体 定义 在 ch06\rtda\heap\method_descriptor.go 文 
件 中 ， 代 码 如 下 : 


package heap 

type MethodDescriptor struct { 
parameterTypes [1]string 
returnType string 


} 


parseMethodDescriptor () 函数 定义 在 
ch06rtda\heap\method_descriptor_parser.go 文 件 中 ， 
为 了 节约 篇 幅 ， 这 里 惑 不 详细 介绍 这 个 函数 了 ， 感 
兴趣 的 读者 请 阅读 随 书 源 代码 。 





7.4 返回 指令 


方法 执行 完毕 之 后 ， 需 要 把 结果 返回 给 调用 
方 ， 这 一 工作 由 返回 指令 完成 。 返 回 指令 属于 控制 
类 指令 ， 一 共有 6 条 。 其 中 retumm 指 令 用 于 没有 返回 


值 的 情况 ，areturn、ireturn、lreturn、freturn 和 








dreturn 分 别 用 于 人 返回 引用 、int、long、float 和 double 
类 型 的 值 。 在 ch07/instructions/control 目 录 下 创建 
return.go， 在 其 中 定义 返回 指令 ， 代 人 码 如 下 : 





package control 

import "jvmgo/ch07/instructions/base" 

import "jvmgo/chO7/rtda" 

type RETURN struct{ base.NoOperandsInstruction } // Return voi 
type ARETURN struct{ base.NoOperandsInstruction } // Return re 
type DRETURN struct{ base.NoOperandsInstruction } // Return do 
type FRETURN struct{ base.NoOperandsInstruction } // Return f1 
type IRETURN struct{ base.NoOperandsInstruction } // Return in 
type LRETURN struct{ base.NoOperandsInstruction } // Return lo 








6 条 返回 指令 都 不 需要 操作 数 。return 指 令 比 较 


简单 ， 只 要 把 当前 帧 从 Java 虚 拟 机 栈 中 弹出 即 可 ， 
它 的 Execute () 方法 如 下 : 
func (self *RETURN) Execute(frame *rtda.Frame) { 


frame.Thread( ).PopFrame() 
} 





其 他 5 条 返回 指令 的 Execute () 方法 都 非常 相 
似 ， 为 了 节约 篇 幅 ， 下 面 只 给 出 ireturn 指 令 的 代码 
《有益 异 的 部 分 已 经 加 粗 ): 





func (self *IRETURN) Execute(frame *rtda.Frame) { 
thread := frame.Thread() 
currentFrame := thread.PopFrame() 
invokerFrame := thread.TopFrame() 
retVal := currentFrame.OperandStack().PopInt() 
invokerFrame.OperandSstack().PushIint(retVal) 


Thread 结 构 体 的 TopFrame 〈) 方法 和 
CurrentFrame 〈) 代码 一 样 ， 这 里 用 不 同 的 名 称 主 
要 是 为 了 避免 混 消 。 方 法 符号 引用 解析 、 参 数 传 








递 、 结 果 返 回 等 都 实现 了 ， 下 面 实现 方法 调用 指 


7.5 方法 调用 指令 


与 7.2 市 类 似 ， 由 于 本 书 不 考虑 接口 的 静态 方法 
和 默认 方法 ， 所 以 要 实现 的 这 4 条 指令 并 没有 完全 
满足 Java 庶 拟 机 规范 第 8 版 的 规定 ， 请 读者 留意 这 一 
点 。 下 面 从 较 人 简单 的 invokestatic 指 令 开 始 。 


7.5.1 invokestatic 指 令 


在 ch07\instructions\references 目 录 下 创建 
invokestatic.go 文 件 ， 在 其 中 定义 invokestatic 指 令 ， 


代码 如 下 : 





package references 

import "jvmgo/ch07/instructions/base" 

import "jvmgo/chO7/rtda" 

import "jvmgo/chO7/rtda/class" 

// Invoke a class (static) method 

type INVOKE_ STATIC struct{ base.Index1i6Instruction } 





结构 体 定 义 比 较 人 简单 ， 直 接 看 Execute () 方 
法 ， 代 码 如 下 : 





func (self *INVOKE_STATIC) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool() 
methodRef := cp.GetConstant(self.Index).(*heap.MethodrRef) 
resolvedMethod := methodRef.ResolvedMethod ( ) 
if !resolved.ISsStatic() { 
panic("java.lang.IncompatibleClassChangeError") 


} 


base.InvokeMethod(frame, resolvedMethod) 


假定 解析 符号 引用 后 得 到 方法 M。M 必 须 是 间 
态 方 法 ， 奋 则 抛 出 Incompatible-ClassChangeError 异 
常 。M 不 能 是 类 初始 化 方法 。 类 初始 化 方法 只 能 
Java 虚 拟 机 调用 ， 不 能 使 用 invokestatic 指 令 调 用 。 
这 一 规则 由 class 文 件 验 证 器 保证 ， 这 里 不 做 检查 。 
如 采 声 明 M 的 类 还 没有 被 初始 化 ， 则 要 先 初 始 化 访 


类 。 将 在 7.8 小 节 讨 论 类 的 初始 化 。 








对 于 invokestatic 指 令 ，M 就 是 最 终 要 执行 的 方 


法 ， 调 用 InvokeMethod () 函数 执行 该 方法 。 


7.5.2 ”invokespecial 指 令 


invokespecial 指 令 在 第 6 章 束 定义 好 了 ， 代 码 如 
下 : 





// Invoke instance method; special handling for superclass, pr 
// and instance initialization method invocations 
type INVOKE_ SPECIAL struct{ base.Index1i6Instruction } 








需要 修改 Execute 〈) 方法 ， 代 码 稍微 有 些 复 





二 
训 
波 
EE 





func (self *INVOKE_ SPECIAL) Execute(frame *rtda.Frame) { 
currentClass := frame.Method().class() 
cp := currentClass.ConstantPool() 
methodRef := cp.GetConstant(self.Index).(*heap.MethodrRef) 
resolvedClass := methodRef.ResolvedClass() 
resolvedMethod := methodRef .ResolvedMethod() 





先 拿 到 当前 类 、 当 前 第 量 池 、 方 法 符号 引用 ， 
用 ， 拿 到 解析 后 的 类 和 方法 。 继 续 


看 代码 : 





if resolvedMethod.Name() == "<init>" && resolvedMethod.cClass() 
panic("java.lang.NoSuchMethodError") 


if resolvedMethod.IsStatic() { 
panic("java.lang.IncompatibleClassChangeError") 








假定 从 方法 符 写 引用 中 解析 出 来 的 类 是 C， 方 
法 是 M。 如 朱 M 和 是 构造 函数 ， 则 声明 M 的 类 必须 是 
C， 否 则 抛 出 NoSuchMethodError 异 销 。 如 果 M 是 青 
态 方 法 ， 则 抛 出 IncompatibleClassChangeError 异 
音 。 继 续 看 代码 : 





ref := frame,.OperandStack( ) ,GetRefFromTop(resolvedMethod .ArgSl 
if ref == nil { 
panic("java.lang.NullPointerException") 








从 操作 数 栈 中 弹出 this 引 用 ， 如 果 该 引用 是 
nul， 抛 出 NullPointerException 异 第 。 注 意 ， 在 传递 


参数 之 前 ， 不 能 破坏 操作 数 栈 的 状态 。 给 
OperandStack 结 构 体 添加 一 个 GetRefFromTop () 
方法 ， 该 方法 返回 距离 操作 数 栈 顶 n 个 单元 格 的 引 
用 变量 。 比 如 GetRefFromTop (0) 返回 操作 数 栈 顶 
引用 ，GetRefFromTop (1) 返回 从 栈 顶 开始 的 倒数 
第 二 个 引用 ， 等 等 。GetRefFromTop() 方法 的 代 
码 很 简单 ， 在 后 面 给 出 。 继 续 看 Execute () 方法 : 


if resolvedMethod.IsProtected() && 
resolvedMethod.Class().IsSuperClassof(currentClass) && 
resolvedMethod.Class().GetPackageName() != currentClass.Get 
ref.Class() != currentClass && 
Iref.Class().ISsSubClassof(currentClass) { 
panic("java.lang.IllegalAccessError") 


上 面 的 判断 确保 protected 方 法 只 能 被 声明 该 方 
法 的 类 或 子 类 调用 。 如 果 违 反 这 一 规定 ， 则 抛 出 
IllegalAccessError 异 常 。 接 着 往 下 看 : 


methodToBeInvoked := resolvedMethod 


if currentClass.IsSuper() && 
resolvedClass.IsSuperClassOof(currentClass) && 
resolvedMethod.Name() != "<init>" 
methodToBeInvoked = heap.LookupMethodInClass(currentClass.s 
methodRef .Name(), methodrRef.Descriptor()) 











上 面 这 段 代 码 比较 难 懂 ， 把 它 翻译 成 更 容易 理 
解 的 语言 : 如 有 果 调 用 的 中 超 类 中 的 函数 ， 但 不 是 构 
造 函数 ， 且 当前 类 的 ACC_SUPER 标 志 被 设置 ， 
要 一 个 额外 的 过 程 碍 找 最 终 要 调用 的 方法 ;人 否则 前 
面 从 方法 符号 引用 中 解析 出 来 的 方法 就 是 要 调用 的 
pa 




















if methodToBeInvoked == nil || methodToBeInvoked.IsAbstract 
panic("java.lang.AbstractMethodError") 


base.InvokeMethod(frame, methodtoBeInvoked) 





如 果 奏 找 过 程 失 败 ， 或 者 找到 的 方法 是 抽象 
的 ， 抛 出 AbstractMethodError 异 稼 。 最 后 ， 如 果 一 
切 正 常 ， 束 调用 方法 。 这 里 之 所 以 这 么 复杂 ， 是 因 





着 


为 调用 超 类 的 〈 非 构造 函数 ) 方法 需要 特别 处 理 。 
限于 篇 幅 ， 这 里 就 不 深入 讨论 了 ， 读 者 可 以 阅读 
Java 虚 拟 机 规范 ， 了 解 类 的 ACC_SUPER 访 问 标志 
的 用 法 。 


OperandStack 结 构 体 GetRefFromTop 〈) 方法 
的 代码 如 下 : 
func (self *OperandStack) GetRefFromTop(n uint) *heap.Object { 


return self.slots[self.size-1-n].ref 


上 


7.5.3 invokevirtual 指 令 


invokevirtual 指 令 也 已 经 在 第 6 章 定 义 好 了 ， 代 
伺 如 下 : 





// Invoke Instance method; dispatch based on class 
type INVOKE_ VIRTUAL struct{ base.Index1i6Instruction } 








下 面 修改 Execute 〈) 方法 ， 第 一 部 分 代码 如 
下 : 





func (self *INVOKE_ VIRTUAL) Execute(frame *rtda.Frame) { 
currentClass := frame.Method().cClass() 
cp := currentClass.ConstantPool() 
methodRef := cp.GetConstant(self.Index).(*heap.MethodRef) 
resolvedMethod := methodRef.ResolvedMethod() 
If resolvedMethod,.IsStatic() { 
panic("java.lang.IncompatibleClassChangeError") 


ref := frame.OperandStack().GetRefFromTop(resolvedMethod.Ar 
if ref == nil { 
// hack System.out.println() 
panic("java.lang.NullPointerException") 


if resolvedMethod.IsProtected() && 
resolvedMethod.class().IsSuperCclassof(currentClass) && 
resolvedMethod.class().GetPackageName() != currentClass. 
ref.Class() != currentClass && 


Iiref.Class().IsSubClassOof(currentClass) { 
panic("java.lang.IllegalAccessError") 





这 部 分 代 介 和 invokespecial 指 令 基本 上 天 不 
多 ， 也 不 多 解释 了 。 下 面 是 剩 下 的 代码 。 








methodToBeInvoked := heap,LookupMethodInCJlass(ref.Class()， 
methodRef .Name(), methodRef .Descriptor()) 

If methodToBeInvoked == nil || methodToBeInvoked.IsAbstract 
panic("java.lang.AbstractMethodError") 


base.InvokeMethod(frame, methodToBeInvoked) 





从 对 象 的 类 中 查找 真正 要 调用 的 方法 。 如 果 找 
不 到 方法 ， 或 者 找到 的 是 抽象 方法 ， 则 需要 抛 出 
AbstractMethodError 异 常 ， 否 则 一 切 正 常 ， 调 用 方 
法 。 注 意 ， 仍 然 要 用 hack 的 方式 调用 
System.out.printtn 〈) 方法 ， 代 码 如 下 : 





func (self *INVOKE_VIRTUAL ) Execute(frame *rtda.Frame) { 
，// 其 他 代码 


ref 


if ref == nil { 


// 
if 


} 


hack! 


methodRef .Name() == "printilin™" { 
_printlin(frame.OperandStack(), methodRef.Descriptor() 


return 


:= frame.OperandStack().GetRefFromTop(resolvedMethod.Ar 


panic("java.lang.NullPointerException") 


，// 其 他 代码 


_printtn 〈) 函数 如 下 : 








func _println(stack *rtda.OperandStack, descriptor string) { 
switch descriptor { 


Case 
Case 
Case 
Case 
Case 
Case 
Case 
Case 


"(Z)V": 
"(C)V": 
"(B)V": 
"(S)V": 
"(I)V": 
"(F)V": 
"(J)V": 
"(D)V": 
default: panic("printlin: 


fmt. 


fmt 


fmt 
fmt 


} 
stack.PopRef() 


Printf("%v\n", 


.Printf("%c\n", 
fmt. 
fmt. 


Printf("%v\n", 
Printf("%v\n", 


.Printf("%v\n", 
.Printf("%v\n", 
fmt. 
fmt. 


Printf("%v\n", 
Printf("%v\n", 


stack. 
stack. 
stack. 
stack. 
stack. 
stack. 
stack. 
stack. 


PopInt() != 0) 
PopInt()) 
PopInt()) 
PopInt()) 
PopInt()) 
PopFloat()) 


PopLong () ) 
PopDouble( )) 


" + descriptor) 


7.5.4 invokeinterface 指 令 


在 ch07instructions\references 目 录 下 创建 
invokeinterface.go 文 件 ， 在 其 中 定义 invokeinterface 


指令 ， 人 代码 如 下 : 





package references 
import "jvmgo/ch07/instructions/base" 
import "jvmgo/chO7/rtda" 
import "jvmgo/cho7/rtda/heap" 
// Invoke interface method 
type INVOKE_ INTERFACE struct { 
index uint 
// count uint8 
// zero uint8 


} 





注意 ， 和 其 他 三 条 方法 调用 指令 略 有 不 同 ， 在 
字 节 人 码 中 ，invokeinterface 指 令 的 操作 人 码 后 面 跟着 4 
字 节 而 非 2? 字 节 。 前 两 字 节 的 含义 和 其 他 指令 相 


同 ， 是 个 uint16 运 行 时 和 常量 池 索 引 。 第 3 字 市 的 值 是 








给 方法 传递 参数 需要 的 slot 数 ， 其 含义 和 给 Method 
结构 体 定义 的 argSlotCount 字 段 相同 。 正 如 我 们 所 
知 ， 这 个 数 是 可 以 根据 方法 插 述 从 计算 出 来 的 ， 它 
的 存在 仅仅 是 因为 历史 原因 。 第 4 字 节 是 留 给 Oracle 
的 汞 些 Java 虚 拟 机 实现 用 的 ， 它 的 值 必须 是 0。 该 字 
节 的 存在 是 为 了 保证 Java 虚 拟 机 可 以 向 后 兼容 。 

















invokeinterface 指 令 的 FetchOperands〈) 方法 
如 下 : 





func (self *INVOKE_INTERFACE) Fetchoperands(reader *base.Bytec 
self.index = uint(reader.ReadUint16()) 
reader .ReadUint8() // count 
reader ,ReadUint8() // must be 0 








下 面 看 Execute 〈) 方法 ， 第 一 部 分 代码 如 下 : 





func (self *INVOKE_INTERFACE) Execute(frame *rtda.Frame) { 
cp := frame.Method().cClass().cCconstantPool() 
methodRef := cp.GetConstant(self.index).(*heap.InterfaceMet 
resolvedMethod := methodRef.ResolvedIinterfaceMethod() 


if resolvedMethod.IsStatic() || resolvedMethod,ISPrivate() 
panic("java.lang.IncompatibleClassChangeError") 








先 从 运行 时 常量 池 中 拿 到 并 解析 接口 方法 符号 
引用 ， 如 末 解 析 后 的 方法 是 静态 方法 或 私有 方法 ， 
则 抛 出 IncompatibleClassChangeError 寞 党。 继续 看 
代码 : 











ref := frame,.OperandStack( ) ,GetRefFromTop(resolvedMethod .ArgSl 
if ref == nil 
panic("java.lang.NullPointerException") 


if !ref.Class().IsImplements(methodRef.ResolvedClass()) { 
panic("java.lang.IncompatibleClassChangeError") 


} 





从 操作 数 栈 中 弹出 this 引 用 ， 如 果 引 用 是 null， 
则 抛 出 NullPointerException 异 常 。 如 果 引 用 所 指 对 
象 的 类 没有 实现 解析 出 来 的 接口 ， 则 抛 出 
IncompatibleClassChangeError 异 常 。 继 续 看 代码 : 





methodToBeInvoked := heap.LookupMethodIinClass(ref.Class(), 


methodRef .Name()，methodRef.Descriptor()) 
if methodToBeInvoked == nil || methodToBeInvoked.IsAbstract() 
panic("java.lang.AbstractMethodError") 


If I!methodToBeInvoked.IsPublic() { 
panic("java.lang.IllegalAccessError") 





查找 最 终 要 调用 的 方法 。 如 果 找 不 到 ， 或 者 找 
到 的 方法 是 抽象 的 ， 则 抛 出 Abstract-MethodError 异 
常 。 如 果 找 到 的 方法 不 是 public， 则 抛 出 
IllegalAccessError 寞 党， 否则 ， 一 切 正 常 ， 调 用 方 
法 : 











base.InvokeMethod(frame, methodToBeInvoked) 


至 此 ，4 条 方法 调用 指令 都 实现 完毕 了 。 再 总 
结 一 下 这 4 条 指令 的 用 途 。invokestatic 指 令 调 用 静 
态 方法 ， 很 好 理解 。invokespecial 指 令 也 比较 好 理 
解 。 首 先 ， 因 为 私有 方法 和 构造 函数 不 需要 动态 绑 








定 ， 所 以 invokespecial 指 令 可 以 加 快 方法 调用 速 
上 度 。 其 次 ， 使 用 super 关 键 字 调用 超 类 中 的 方法 不 能 
使 用 invokevirtual 指 令 ， 人 否则 会 陷入 无 限 循环 。 





那么 为 什么 要 单独 定义 invokeinterface 指 令 呢 ? 
统一 使 用 invokevirtual 指 令 不 行 吗 ? 答案 是 ， 可 
以 ， 但 是 可 能 会 影响 效率 。 这 两 条 指令 的 区 别 在 
于 : 当 Java 虚 拟 机 通过 invokevirtual 调 用 方法 时 ， 
this 引 用 指向 某 个 类 (或 其 子 类 ) 的 实例 。 因 为 类 
的 继承 层次 是 固定 的 ， 所 以 虚拟 机 可 以 使 用 一 种 叫 
作 vtable (Virtual Method Table) 的 技术 加 速 方法 查 
找 。 但 是 当 通 过 invokeinterface 指 令 调 用 接口 方法 
时 ， 因 为 this 引 用 可 以 指 同 任何 实现 了 该 接口 的 类 
的 实例 ， 所 以 无 法 使 用 vtable 技 术 。 





由 于 访 幅 限制 ， 这 里 就 不 深入 讨论 vtable 技 术 


了 。 感 兴趣 的 读者 可 以 阅读 相关 资料 ， 或 者 改进 我 
们 的 代码 ， 给 invokevirtual 指 令 增 加 vtable 优 化 。 


4 条 方法 调用 指令 和 6 条 返回 指令 都 准备 好 了 ， 
还 需要 修改 ch07instructions\factory.go 文 件 ， 在 其 中 
增加 这 些 指令 的 case 语 句 。 鉴 于 改动 比较 简单 ， 这 


里 就 不 给 出 代码 了 。 


7.6 ”改进 解释 从 


我 们 的 解释 器 目前 只 能 执行 单个 方法 ， 现 在 就 
扩展 它 ， 让 它 文 持 方 法 调用 。 打 开 
ch07interpreter.go 文 件 ， 修 改 interpret〈) 方法 ， 代 
人 码 如 下 : 








func interpret(method *heap.Method, logInst bool) { 
thread := rtda.NewThread ( ) 
frame := thread,NewFrame(method ) 
thread.PushFrame(frame ) 
defer catchErr(thread ) 
loop(thread, logInst) 





logInst 参 数控 制 是 否 把 指令 执行 信息 打印 到 控 
制 合 。 更 重要 的 变化 在 loop 〈) 函数 中 ， 代 码 如 下 
所 示 : 








func loop(thread *rtda.Thread, logInst bool) { 
reader := &base.BytecodeReadert{} 
for { 


frame := thread.CurrentFrame() 
pc := frame.NextPC() 
thread .SetPC(pc ) 
// decode 
reader .Reset(frame.Method().Code(), pc) 
opcode := reader.ReadUint8() 
inst := instructions.NewInstruction(opcode) 
inst.FetchOperands(reader) 
frame.SetNextPpC(reader.PC()) 
If (logInst) { 
logInstruction(frame, inst) 


// execute 
inst.Execute(frame) 
If thread.IsStackEmpty() { 
break 
} 
} 
} 





在 每 次 循环 开始 ， 先 拿 到 当前 帧 ， 然 后 根据 pc 
从 当前 方法 中 解码 出 一 条 指令 。 指 令 执行 完毕 之 
后 ， 判 断 Java 虚 拟 机 栈 中 是 否 还 有 帧 。 如 果 没 有 则 
退出 循环 ， 否 则 继续 。Thread 结 构 体 的 
IsStackEmpty《〈) 方法 是 新 增加 的 ， 代 码 在 
ch07\rtda\thread.go 中 ， 如 下 所 示 : 





func (self *Thread) IsStackEmpty() bool { 
return self.stack.isEmpty() 


. 


它 只 是 调用 了 Stack 结 构 体 的 isEmpty () 方 
法 ， 代 码 在 ch07\rtda\jvm_stack.go 中 ， 如 下 所 示 : 


func (self *Stack) isEmpty() bool { 
return self._top == nil 


} 


回 到 interpreter.go， 如 采 解 释 器 在 执行 期 间 出 
现 了 问题 ，catchErr () 函数 会 打印 出 错 信 息 ， 代 
码 如 下 : 


func catchErr(thread *rtda.Thread) { 


if r := recover(); r != nil { 
logFrames(thread) 
panic(r) 


logFrames《) 函数 打印 Java 虚 拟 机 栈 信 息 ， 代 
人 码 如 下 : 


func logFrames(thread *rtda.Thread) { 


for !thread.ISsStackEmpty() { 


frame := thread.PopFrame() 
method := frame.Method() 
className := method.Class().Name() 


fmt.Printf(">> pc:%4d %v.%v%v \n", 
frame.NextPC(), className, method.Name(), method.Desc 





logInstruction 〈) 函数 在 方法 执行 过 程 中 打印 
言 妃 ?9 代码 如 下 : 





func logInstruction(frame *rtda.Frame, inst base.Instruction) 


method := frame.Method() 

className := method.Class().Name() 

methodName := method.Name() 

pc := frame.Thread().PC() 

fmt.Printf("%v.%v() #%2d %T %v\n", className, methodName, Fr 





解释 强 改 造 完毕 ， 下 面 测 试 方法 调用 。 


7.7” 训 斌 方法 调用 


先 改 造 命 令 行 工 具 ， 给 它 增 加 两 个 选项 。java 
命令 提供 了 -verbose: class〈 简 写 为 -verbose) 选 
项 ， 可 以 控制 是 否 把 类 加 载 信息 输出 到 控制 台 。 也 
增加 这 样 一 个 选项 ， 另 外 参照 这 个 选项 增加 一 个 - 
verbose: inst 选 项 ， 用 来 控制 是 否 把 指令 执行 信息 
输出 到 控制 台 。 


五 








打开 ch07vcmd.go 文 件 ， 修 改 Cmd 结 构 体 如 下 : 


type Cmd struct { 


helpFlag bool 
versionFlag bool 
verboseClassFlag bool 
verboseInstFlag bool 
cpOption string 
XjreOoption string 
class string 
args []string 


二 一 


parseCmd《〈) 函数 也 需要 修改 ， 改 动 比 较 人 简 
单 ， 这 里 就 不 给 出 代码 了 。 下 面 修改 ch07\main.go 
文件 ， 其 他 地 方 不 变 ， 只 需要 修改 starJVM () 函 
数 ， 代 码 如 下 : 





func startJVM(cmd *Cmd) { 
cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 


classLoader := heap.NewClassLoader(cp, cmd.verboseClassFlag 
className := strings.Replace(cmd.class, ".", "/", -1) 
mainClass := classLoader.Loadclass(className) 
mainMethod := mainClass.GetMainMethod() 
If mainMethod != nil { 

interpret(mainMethod, cmd.verboseInstFlag) 
} else { 


fmt.Printf("Main method not found in class %s\n", cmd.cl 


了 
} 





然后 修改 ch07\rtda\heap\class_loader.go 文 件 ， 
给 ClassLoader 结 构 体 添加 verboseFlag 字 段 ， 代 码 如 
下 : 





type ClassLoader struct { 
cp *classpath.cClasspath 
verboseFlag bool 
classMap map[string]*Class 





NewClassLoader () 函数 要 相应 修改 ， 改 动 如 
下 : 





func NewClassLoader(cp *classpath.Classpath, verboseFlag bool) 
return &ClassLoadert{ 


cp: cp, 
verboseFlag: verboseFlag, 
classMap: make(map[string]*Class), 


} 





loadNonArrayClass〈) 函数 也 要 修改 ， 改 动 如 
下 : 





func (self *ClassLoader) loadNonArrayClass(name string) *Class 


data, entry := self.readClass(nanme) 
class := self.defineClass(data) 
link(class) 


if self.verboseFlag { 
fmt.Printf("[Loaded %s from %s]\n", name, entry) 


return class 





一 切 都 准备 束 绪 ， 打 开 命 令 行 窗 口 ， 执 行 下 面 


的 命令 编译 本 章 代 人 码 : 





go install jvmgo\ch0o7 





命令 执行 完毕 后 ， 在 D: \go\workspace\bin 目 录 
下 出 现 ch07.exe 文 件 。 下 和 面 这 个 类 演示 了 各 种 情况 
下 ，4 种 方法 调用 命令 的 使 用 。 





package jvmgo,book ,cho7 
public class InvokeDemo implements Runnable { 
public static void main(String[] args) { 
new InvokeDemo().test(); 


public void test() { 


InvokeDemo.staticMethod(); // invokestatic 
InvokeDemo demo = new InvokeDemo( ) ， // invokespecial 
demo.instanceMethod(); // invokespecial 
super .equals (null); // invokespecial 
this.run(); // invokevirtual 
((Runnable) demo).run(); // invokeinterfa 


public static void staticMethod() {} 
private void instanceMethod() {} 
@override public void run() 人 





用 javac 编 译 InvokeDemo 类 ， 然 后 用 ch07.exe 执 


行 InvokeDemo 程 序 ， 可 以 看 到 程序 正常 执行 (没有 
任何 输出 ) ， 如 图 7-3 所 示 。 





加 命令 得 示 符 一 口 xX 


:NgoVWorkspacevbin>ch07. exe -Xijre “C:\Program Files\Java\irel. .0 66” jvmeo. boolG 
.ch07. InvokeDemo 






图 7-3 ”InvokeDemo 执 行 结 果 


InvokeDemo 只 是 演示 ， 下 耐看 一 个 稍微 复杂 一 
些 的 例子 。 





package jvmgo.book.cho7; 
public class FibonacciTest { 
public static void main(String[] args) { 
long x = fibonacci(30); 
System.out.printlin(x); 


private static long fibonacci(long n) { 
if (n <= 1) { return n; } 
return fibonacci(n - 1) + fibonacci(n - 2); 
上 
} 





FibonacciTest 关 演示 了 裴 波 那 自 数列 的 计算 ， 
用 javac 编 译 它 ， 然 后 用 ch07.exe 执 行 ， 结 果 如 图 7-4 


所 示 。 





罗 命令 提示 符 es 口 xX 


D:\go\workspace\bin>ch07. exe -Xijre “C:\Program Files\Java\ijrel. 8.0 66” jrmeo. boo 
k. ch07.FibonacciTest 


832040 





图 7-4 ” ”FibonacciTest 执 行 结 果 


几 秒 钟 集 顿 之 后 ， 控 制 全 上 打印 出 了 832040。 
我 们 的 Java 虚 拟 机 终于 可 以 执行 复杂 计算 了 。 方 法 
调用 指令 融 测 试 到 这 里 ， 下 面 在 本 章 的 最 后 ， 讨 论 
类 的 初始 化 。 


7.8 ”类 初始 化 


第 6 章 实现 了 一 个 简化 版 的 类 加 载 器 ， 可 以 把 
类 加 载 到 方法 区 中 。 但 是 因为 当时 还 没有 实现 方法 
调用 ， 所 以 没有 办 法 初始 化 类 。 现 在 可 以 把 这 个 逻 
辑 补 上 上 了。 我 们 已 经 知道 ， 类 初始 化 就 是 执行 类 的 
初始 化 方法 〈<clinity) 。 类 的 初始 化 在 下 列 情况 下 
触发 : 








“ 执行 hew 指 令 创 建 类 实例 ， 但 类 还 没有 被 初 


始 化 。 


` 执行 putstatic、 getstatic 指 令 存 取 类 的 静态 变 
量 ， 但 声明 该 字段 的 类 还 没有 被 初始 化 。 


. 执行 invokestatic 调 用 类 的 静态 方法 ， 但 声明 


该 方法 的 类 还 没有 被 初始 化 。 


当初 始 化 一 个 类 时 ， 如 果 类 的 超 类 还 没有 被 
初始 化 ， 要 先 初 始 化 类 的 超 类 。 
. 执行 某 些 反射 操作 时 。 


为 了 判断 类 是 人 否 已 经 初始 化 ， 需 要 给 Class 结 构 


type Class Struct { 
.，// 其 他 字段 


initStarted bool 


类 的 初始 化 其 实 分 为 几 个 阶段 ， 但 由 于 我 们 的 


类 加 载 右 还 不 够 完善 ， 所 以 先 使 用 一 个 简单 的 布尔 


状态 就 足够 了 。initStarted 字 段 表 示 类 的 <clinit> 方 





法 是 售 己 经 开始 执行 。 接 下 来 给 Class 续 构 体 旋 加 两 
个 方法 ， 代 人 码 如 下 : 





func (self *Class) InitStarted() bool { 
return self.initStarted 


func (self *Class) StartInit() { 
self.initStarted = true 


| 





InitStarted () 是 Getter 方 法 ， 返 回 initStarted 字 
段 值 。Startmit 〈) 方法 把 initStarted 字 段 设 置 成 
true。 下面 修改 new 指 令 ， 代 码 如 下 : 





func (self *NEW) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool() 
classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 
class := classRef.ResolvedClass() 
if I!class.InitStarted() { 
frame.RevertNextPC() 
base.InitClass(frame.Thread(), class) 
return 


，// 其 他 代码 





putstatic 和 getstatic 指 令 改 动 类 似 ， 以 putstatic 指 


令 为 例 ， 代 码 如 下 : 





func (self *PUT_STATIC) Execute(frame *rtda.Frame) { 
，// 其 他 代码 


field := fieldRef.ResolvedField() 

class := field.Class() 

if I!class.InitStarted() { 
frame.RevertNextPC() 
base.InitClass(frame.Thread(), class) 
return 


，// 其 他 代码 





invokestatic 指 令 也 需要 修改 ， 改 动 如 下 : 





func (self *INVOKE_ STATIC) Execute(frame *rtda.Frame) { 
，// 其 他 代码 


class := resolvedMethod.cClass() 

if !class.InitStarted() { 
frame.RevertNextPC() 
base.InitClass(frame.Thread(), class) 
return 


} 


base.InvokeMethod(frame, resolvedMethod) 


4 条 指令 都 修改 完毕 了 ， 但 是 新 增加 的 代码 做 
了 些 什 么 ? 先 判断 类 的 初始 化 是 否 已 经 开始 ， 如 采 
还 没有 ， 则 需要 调用 类 的 初始 化 方法 ， 并 终止 指令 
执行 。 但 是 由 于 此 时 指令 已 经 执行 到 了 一 半 ， 也 就 
是 说 当前 帧 的 nextPC 字 段 已 经 指向 下 一 条 指令 ， 所 
以 需要 修改 nextPC， 让 它 重 新 指向 当前 指令 。 
Frame 结 构 体 的 RevertNextPC 〈) 方法 做 了 这 样 的 
操作 ， 代 码 如 下 : 


func (self *Frame) RevertNextPC() { 
self.nextPC = self.thread.pc 
} 


nextPC 调 整 好 之 后 ， 下 一 步 人 查找 并 调用 类 的 初 


始 化 方法 。 这 个 逻辑 是 通用 的 ， 在 
ch07\instructions\base\class_init_logic.go 文 件 中 实现 


代码 如 下 : 





func InitClass(thread *rtda.Thread, class *heap.Class) { 
class.StartInit() 
scheduleClinit(thread, class) 
initSuperClass(thread, class) 


. 





InitClass 《) 函数 先 调 用 StartInit() 方法 把 类 
的 initStarted 状 态 设 置 成 tue 以 免 进 入 死 循 环 ， 然 后 
调用 scheduleClinit() 函数 准备 执行 类 的 初始 化 方 
a 





func scheduleClinit(thread *rtda.Thread, class *heap.Class) { 
clinit := class.GetClinitMethod() 


If clinit != nil { 
// exec <clinit> 
newFrame := thread.NewFrame(clinit) 


thread.PushFrame (newFrame) 





类 初始 化 方法 没有 参数 ， 所 以 不 需要 传递 参 
数 。Class 结 构 体 的 GetClinitMethod () 方法 如 下 : 





func (self *Class) GetClinitMethod() *Method { 
return self.getStaticMethod("<clinit>", "()V") 


} 


注意 ， 这 里 有 意 使 用 了 scheduleClinit 这 个 函数 


名 而 非 invokeClinit， 因 为 有 可 能 要 先 执行 超 类 的 初 
始 化 方法 ， 如 函数 initSuperClass 〈) 所 示 。 


func initSuperClass(thread *rtda.Thread, class *heap.Class) { 


if Iclass.IsInterface() { 
superClass := class.SuperClass() 
if superClass != nil && !superClass.InitStarted() { 


InitClass(thread, superClass) 
} 


} 
上 





如 果 超 类 的 初始 化 还 没有 开始 ， 融 递归 调用 
PitClass〈) 函数 执行 超 类 的 初始 化 方法 ， 这 样 可 
以 保证 超 类 的 初始 化 方法 对 应 的 帧 在 子 类 上 面 ， 使 
超 类 初始 化 方法 先 于 子 类 执行 。 

类 的 初始 化 逻辑 写 完了 ， 由 于 访 幅 限制 ， 这 里 


就 不 进行 测试 了 。 读 者 可 以 参考 随 书 Java 示 例 代 
码 ， 或 者 自行 编写 Java 程 序 进行 测试 。 不 过 在 进行 
测试 之 前 ， 还 需要 增加 一 个 小 小 的 hack。 由 于 目前 
还 不 文 持 本 地 方法 调用 ， 而 Java 类 库 中 的 很 多 类 都 
要 注册 本 地 方法 ， 比 如 Object 类 就 有 一 个 
registerNatives 〈) 本 地 方法 ， 用 于 注册 其 他 方法 ， 
代码 如 下 : 


// jJava.lang.Object 
public class Object { 
private static native void registerNatives(); 
static { 
registerNatives(); 


} 
' ， // 其 他 代码 





由 于 Object 类 是 其 他 所 有 类 的 超 类 ， 所 以 这 会 
叶 任 Java 虚 拟 机 朋 沉 。 解 决 办 法 是 修改 


InvokeMethod〈) 函数 《代码 在 
chO7\instructions\base\method_invoke_logic.go 文 件 
中 ) ， 让 它 跳 过 所 有 registerNatives () 方法 ， 改 动 
wk 





package base 

import "fmt" 

import "jvmgo/chO7/rtda" 

import "jvmgo/cho7/rtda/heap" 

func InvokeMethod(invokerFrame *rtda.Frame, method *heap.Methc 
，// 前面 的 代码 不 变 ， 下 面 是 


hack! 


If method,.IsNative() { 
if method.Name() == "registerNatives" { 
thread.PopFrame( ) 
} else { 
panic(fmt.Sprintf("native method: %v.%v%v\n", 
method.Cclass().Name(), method.Name(), method.Descr 





如 果 人 过 到 其 他 本 地 方法 ， 直 接 调 用 panic() 杨 
数 终止 程序 执行 即 可 。 将 在 第 9 章 讨 论 本 地 方法 调 


7.9 本 章 小 结 


本 和 草 讨论 了 方法 调用 和 返回 ， 并 且 实 现 了 类 初 
始 化 刘 辑 。 如 果 说 在 前 面 几 章 里 ， 我 们 的 Java 虚 拟 
机 还 是 个 小 baby 只 会 人 的 话 ， 到 了 本 章 结尾 ， 它 已 
经 可 以 满 地 跑 了 。 下 一 章 将 讨论 数组 和 字符 串 ， 忆 
时 ， 我 们 的 小 baby 就 有 更 多 的 玩具 可 以 玩 要 了 。 


第 8 章 ”数组 和 字符 串 


在 大 部 分 编程 语言 中 ， 数 组 和 字符 串 都 是 最 基 
本 的 数据 类 型 。Java 虚 拟 机 直接 支持 数组 ， 对 字符 
串 的 支持 则 由 java.lang.String 和 相关 的 类 提供 。 本 章 
分 为 两 部 分 ， 前 半 部 分 讨论 数组 和 数组 相关 指令 ， 


后 半 部 分 讨论 字符 囊 。 


在 本 章 的 讨论 中 ， 数 组 一 般 指 数组 对 象 ; 在 
不 至 于 引起 混淆 的 情况 下 ， 也 可 能 指数 组 尖 ; 在 其 
他 情况 下 ， 会 明确 指出 是 数组 类 还 是 数组 对 象 。 
如 果 数 组 的 元 素 是 基本 类 型 ， 就 把 它 叫 作 基 本 类 型 
数组 ， 否 则 ， 数 组 的 元 素 是 引用 类 型 ， 把 它 叫 作 引 
用 类 型 数组 。 基 本 类 型 数组 肯定 都 是 一 维 数组 ， 
如 果 引 用 类 型 数组 的 元 素 也 是 数组 ， 那 么 它 就 是 多 


维 数 组 。 


开始 学 习 本 章 之 前 ， 还 是 先 把 目录 结构 准备 
好 。 复 制 chn07 目 录 ， 改 名 为 ch08。 修 改 main.go 等 文 
件 ， 把 impott 语 名 中 的 ch07 全 都 替换 成 ch08。 本 章 
对 目录 结构 没有 太 大 的 调整 。 


8.1 数组 概述 


数组 在 Java 虚 拟 机 中 是 个 比较 特殊 的 概念 。 为 
什么 这 么 说 呢 ? 有 下 面 几 个 原因 : 


首先 ， 数 组 类 和 普通 的 类 是 不 同 的。 普通 的 类 
从 class 文 件 中 加 载 ， 但 是 数组 类 由 Java 虚 拟 机 在 运 
行 时 生成 。 数 组 的 类 名 是 左 方 括号 〈[) + 数组 元 素 
的 类 型 描述 符 : 数组 的 类 型 描述 符 就 是 类 名 本 刁 。 
例如 ，int[] 的 类 名 十 [I，int[]0D 的 类 名 古 [[I，Object[] 
的 类 名 是 [Ljava/lang/Object; ，String[][] 的 类 名 是 





[[java/lang/String; ， 等 等 。 


其 次 ， 创 建 数组 的 方式 和 创建 普通 对 象 的 方式 
不 同 。 普 通 对 象 由 new 指 令 创 建 ， 然 后 由 构造 函数 
初始 化 。 基 本 类 型 数组 由 newarray 指 令 创 建 ; 引用 


类 型 数组 由 anewarray 指 令 创 建 ; 另外 还 有 一 个 专门 
的 multianewarray 指 令 用 于 创建 多 维 数组 。 








最 后 ， 很 显然 ， 数 组 和 普通 对 象 存放 的 数据 也 
是 不 同 的 。 普 通 对 象 中 存放 的 是 实例 变量 ， 通 过 
putfield 和 getfield 指 令 存 取 。 数 组 对 象 中 存放 的 则 是 
数组 元 素 ， 通 过 <t>aload 和 <t>astore 系 列 指令 按 有 乏 
引 存 取 。 其 中 <t> 可 以 是 a、b、c、d、f i、] 或 者 
s， 分 别 用 于 存 取 引 用 、byte、char、double、 
float、int、long 或 short 关 型 的 数组 。 另 外 ， 还 有 一 
个 arraylength 指 令 ， 用 于 获取 数组 长 度 。 

















Java 虚 拟 机 规范 给 了 实现 者 充分 的 目 由 来 实现 
数组 ， 下 面 束 动手 吧 ! 


8.2 ”数组 实现 


将 在 类 和 对 象 的 基础 上 实现 数组 类 和 数组 对 
象 ， 先 来 看 数组 对 象 。 


8.2.1 数组 对 象 


和 普通 对 象 一 样 ， 数 组 也 是 分 配 在 堆 中 的 ， 通 
过 引用 来 使 用 。 所 以 需要 改造 Object 结 构 体 ， 让 它 
既 可 以 表示 普通 的 对 象 ， 也 可 以 表示 数组 。 打 开 
ch08\rtda\heap\object.go， 修 改 Object 结 构 体 ， 改 动 
ws 


type Object struct { 
S *Class 
data interfacef{} 


把 fields 字 段 改 为 data， 类 型 也 从 Slots 变 成 了 
interface{}。Go 语 言 的 interface{} 类 型 很 像 C 语 言 中 
的 void*， 访 类 型 的 变量 可 以 容纳 任何 类 型 的 值 。 对 
于 普通 对 象 来 说 ，data 字 段 中 存放 的 仍然 还 是 Slots 


变量 。 但 是 对 于 数组 ， 可 以 在 其 中 放 各 种 类 型 的 数 
组 ， 详 见 下 文 。newObject 〈) 用 来 创建 普通 对 
象 ， 因 此 需要 做 相应 的 调整 ， 改 动 如 下 : 


func newObject(class *Class) *Object { 
return &0bjectt{ 
class: class, 
data: newSlots(class.instanceSlotCount), 
} 
} 


因为 Fields () 方法 也 仍然 只 针对 普通 对 象 ， 
所 以 它 的 代码 也 需要 做 相应 调整 ， 如 下 所 示 : 


func (self *Object) Fields() Slots { 
return self.data. (Slots) 
} 


需要 给 Object 结构 体 添 加 几 个 数组 特有 的 方 
法 ， 为 了 让 代码 更 加 清晰 ， 在 单独 的 文件 中 定义 这 
些 方 法 。 在 ch08/rtda/heap 目 录 下 创建 array_object.go 


文件 ， 在 其 中 实现 8 个 方法 ， 代 码 如 下 : 





package heap 

func (self *Object) Bytes() [|]int8 { return self.data.([]int8) 
func (self *Object) Shorts() [J]int16 { return self.data.([]int 
func (self *Object) Ints() [J]int32 { return self.data.([]int32 
func (self *Object) Longs() [|]int64 { return self.data.([]inté 
func (self *Object) Chars() [J]uint16 { return self.data.([]uin 
func (self *Object) Floats() [|]float32 { return self.data.([]f 
func (self *Object) Doubles() [|]float64 { return self.data.([] 
func (self *Object) Refs() []*Object { return self.data.([]*Ob 





上 面 这 8 个 方法 分 别针 对 引用 类 型 数组 和 7 种 基 
本 类 型 数组 返回 具体 的 数组 数据 。 继 续 编 辑 
array_object.go 文 件 ， 在 其 中 添加 ArrayLength () 
方法 > 人 但 如 下 : 





func (self *Object) ArrayLength() int32 { 
Switch self.fields.(type) { 
case [|]int8: return int32(len(self.data.([|]int8))) 
case [|]int16: return int32(len(self.data.([]int16))) 
case [1]int32: return int32(len(self.data.([]l]int32))) 
case [|]int64: return int32(len(self.data.([]int64))) 
case [juint16: return int32(len(self.data.([]uint16))) 
case []float32: return int32(Jen(Self.data.([]float32))) 
case [|]float64: return int32(len(self.data.([]float64))) 
case []*Object: return int32(len(self.data.([]*Oobject))) 
default: panic("Not array!") 
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读者 也 许 会 好 奇 ， 为 什么 返回 数组 数据 的 方法 
有 8 个 ， 但 却 只 有 一 个 统一 的 ArrayLength〈) 方法 
呢 ? 答案 是 ， 这 些 方法 主要 是 供 <t>aload、 
<t>astore 和 arraylength 指 令 使 用 的 。<t>aload 和 
<t>astore 系 列 指令 各 有 8 条 ， 上 所 以 针对 每 种 类 型 都 
提供 一 个 方法 ， 返 回 相 应 的 数组 数据 。 因 为 
arraylength 指 令 只 有 一 条 ， 所 以 ArrayLength () 方 
法 需要 目 己 判 断 数 组 类 型 。 


那么 为 什么 没有 实现 Booleans《〈) 方法 呢 ? 
为 将 使 用 [Jint8 来 表示 布尔 数组 ， 所 以 只 需要 
Bytes〈() 方法 即 可 。 心 急 的 读者 可 以 移 跳 到 8.3 小 
方 ， 看 看 数组 相关 指令 是 如 何 实现 的 。 下 面 实现 数 


组 类 。 





8.2.2 ”数组 类 


不 需要 修改 Class 结 构 体 ， 只 给 它 添 加 几 个 数组 
特有 的 方法 即 可 。 为 了 强调 这 些 方 法 只 针对 数组 
类 ， 同 时 也 避免 class.go 文 件 变 得 过 长 ， 把 这 些 方 法 
定义 在 新 的 文件 中 。 





在 ch08/rtda/heap 目 录 下 创建 array_class.go 文 
件 ， 在 其 中 定义 NewArray() 方法 ， 代 人 码 如 下 : 





func (self *Class) NewArray(count uint) *Object { 
If !self.IsArray() { 
panic("Not array class: " + Self.name) 


switch self.Name() { 

case "[Z": return &Object{self, make([]int8, count)} 
case "[B": return &Object{self, make([]int8, count)} 
case "[C": return &Object{self, make([]Juint16, count)} 
case "[S": return &Object{self, make([]int16, count)} 
case "[I": return &Object{self, make([]int32, count)} 
case "[J": return &Object{self, make([]int64, count)} 
case "[F": return &Object{self, make([]float32, count)} 
case "[D": return &Object{self, make([]float64, count)} 
default: return &Object{self, make([]1*Object, count)} 


} 


NewArray〈) 方法 专门 用 来 创建 数组 对 象 。 如 
果 类 并 不 是 数组 类 ， 就 调用 panic《〈) 函数 终止 程序 
执行 ， 和 否则 根据 数组 类 型 创建 数组 对 象 。 注 意 : 布 
尔 数组 是 使 用 字 节 数组 来 表示 的 。 继 续 编辑 
array_class.go， 在 其 中 定义 ISArray() 方法 ， 代 码 
如 下 : 





func (self *Class) IsArray() bool { 
return self.name[0] == "[" 


还 会 在 array_class.go 文 件 中 实现 其 他 几 个 方 
法 ， 等 用 到 时 再 介绍 。 下 面 修改 类 加 载 器 ， 让 它 可 
以 加 载 数组 类 。 


8.2.3 加载 数组 类 


打开 ch08\rtda\heap\class_loader.go 文 件 ， 修 改 
LoadClass〈) 方法 ， 改 动 如 下 : 





func (self *ClassLoader) LoadClass(name string) *Class { 
if class, ok := self.classMap[namel]; ok { 
return class // 已 经 加 载 


if name[0] == '[" { 
return self.loadArrayClass (nanme) 


return self.loadNonArrayClass(nanme) 


} 





这 里 增加 了 类 型 判断 ， 如 末 要 加 载 的 类 是 数组 
类 ， 则 调用 新 的 loadArrayClass () 方法 ， 否 则 还 按 
照 原 来 的 逻辑 。loadArrayClass〈) 方法 需要 生成 一 
个 Class 结 构 体 实例 ， 代 码 如 下 : 


func (self *ClassLoader) loadArrayClass(name string) *Class { 


class := &Classt 


accessFlags: ACC_PUBLIC, // todo 

name : name ， 

loader: self, 

initStarted: true, 

superClass: self.LoadClass("java/lang/Object"), 
interfaces: []*Classt{ 


self.LoadClass("java/lang/Cloneable"), 
self.LoadClass("java/io/Serializable"), 


}, 


self.classMap[name] = class 
return class 





前 面 三 个 字段 的 值 比较 好 理解 ， 不 多 解释 。 
为 数组 类 不 需要 初始 化 ， 所 以 把 initStarted 字 段 设 置 
成 true。 数 组 类 的 超 类 是 java.lang.Object， 并 且 实 现 








了 java.lang.Cloneable 和 java.io.Serializable 接 口 。 类 
加 载 器 改造 完毕 ， 下 面 来 实现 数组 相关 指令 ， 


8.3 ”数组 相关 指令 


本 节 要 实现 20 条 指令 ， 其 中 newarray、 
anewarray、mnultianewarray 和 arraylength 指 令 属 于 引 
用 类 指令 ;，<t>aload 和 <t>astore 系 列 指令 各 有 8 条 ， 
分 别 属于 加 载 类 和 存储 类 指令 。 下 面 的 Java 程 序 演 
示 了 部 分 数组 相关 指令 的 用 处 。 





public class ArrayDemo { 
public static void main(String[] args) { 


int[] al = new int[10]; // newarray 
String[|] a2 = new String[10]; // anewarray 
int[][] a3 = new int[10][10]; // multianewarray 
int x = ali.length; // arraylength 

al[0] = 100; // iastore 

int y = a1i[0]; // iaload 

a2[0] = "abc"; // aastore 

String s = a2[0]; // aaload 





下 面 从 newarray 指 令 开 始 。 


8.3.1 newarray 指 令 


newarray 指 令 用 来 创建 基本 类 型 数组 ， 包 括 
boolean[]、 byte[]、 char[]、 short[]、int[]、long[]、 
float[] 和 double[]8 种 。 在 ch08\instructions\references 
目录 下 创建 newarray.go， 在 其 中 定义 newarray 指 
令 ， 代 码 如 下 : 





package references 

import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 

import "jvmgo/cho8/rtda/heap" 

const (...) // atype 常 量 


// Create new array of primitive 
type NEW_ARRAY struct { 
atype uint8 





newarray 指 令 需 要 两 个 操作 数 。 第 一 个 操作 数 


是 一 个 uint8 整 数 ， 在 字 市 码 中 案 跟 在 指令 操作 人 码 后 


面 ， 表 示 要 创建 哪 种 类 型 的 数组 。Java 虚 拟 机 规范 
把 这 个 操作 数 叫 作 atype， 并 且 规 定 了 它 的 有 效 值 。 
把 这 些 值 定义 为 和 常量， 代码 如 下 : 








const ( 

AT_BOOLEAN 
AT_CHAR 
AT_FLOAT 
AT_DOUBLE 
AT_BYTE 
AT_SHORT 
AT_INT 
AT_LONG 


以 卢 oo、~iOOJO 人 


© 


FetchOperands () 方法 读 取 atype 的 值 ， 代 人 码 如 
下 : 


func (self *NEW_ ARRAY) Fetchoperands(reader *base.BytecodeRead 
self.atype = reader.ReadUint8() 
} 


newarray 指 令 的 第 二 个 操作 数 是 count， 从 操作 
数 栈 中 弹出 ， 表 示 数 组 长 度 。Execute () 方法 根据 


atype 和 count 创 建 基本 类 型 数组 ， 代 码 如 下 : 





func (self *NEW_ARRAY) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
count := stack.PopInt() 
If count < 0 ft 
panic("java.lang.NegativeArraySizeException") 


classLoader := frame.Method().Class().Loader() 

arrClass := getPrimitiveArrayClass(classLoader, self.atype) 
arr := arrClass.NewArray(uint(count)) 

stack.PushRef (arr) 





如 果 count 小 于 0， 则 抛 出 
NegativeArraySizeException 异 常 ， 否 则 根据 atype 值 
使 用 当前 类 的 类 加 载 器 加 载 数 组 类 ， 然 后 创建 数组 
对 象 并 推 入 操作 数 栈 。getPrimitiveArrayClass () 
函数 的 代码 如 下 : 








func getPrimitiveArrayClass(loader *heap.ClassLoader, atype ui 
switch atype { 


case AT_BOOLEAN : return loader.LoadCclass("[Z") 
case AT_BYTE: return loader.LoadCclass("[B") 
case AT_CHAR: return loader.LoadcCclass("[C") 
case AT_SHORT : return loader.LoadcCclass("[S") 
case AT_INT: return loader.Loadclass("[I") 
case AT_LONG: return loader.LoadcCclass("[J") 


case AT_FLOAT: return loader.LoadCclass("[F") 


case AT_DOUBLE : return loader.LoadCclass("[D") 
default: panic("Invalid atype!") 
} 

} 





下 面 实现 anewarray 指 令 。 


8.3.2 anewarray 指 令 


anewarray 指 令 用 来 创建 引用 类 型 数组 。 在 
ch08\instructions\references 目 录 下 创建 anewarray.go 
文件 ， 在 其 中 定义 anewarray 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/ch08/instructions/base" 

import "jvmgo/cho8/rtda" 

import "jvmgo/cho8/rtda/heap" 

// Create new array of reference 

type ANEW_ARRAY struct{ base.Index1i6Instruction } 





anewarray 指 令 也 需要 两 个 操作 数 。 第 一 个 操作 
数 古 uint16 索 引 ， 来 目 字 市 码 。 通 过 这 个 索引 可 以 
从 当前 类 的 运行 时 常量 池 中 找到 一 个 类 符号 引用 ， 
解析 这 个 符号 引用 残 可 以 得 到 数组 元 素 的 类 。 第 二 
个 操作 数 是 数组 长 度 ， 从 操作 数 栈 中 弹出 。 
Execute〈) 方法 根据 数组 元 素 的 类 型 和 数组 长 度 创 





建 引用 类 型 数组 ， 代 码 如 下 : 





func (self *ANEW_ARRAY) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool() 
classRef := cp.GetConstant(self.Index).(*rtc.ClassRef) 
componentClass := classRef.ResolvedcClass() 
stack := frame.OperandStack() 
count := stack.PopInt() 
If count < 0 { 

panic("java.lang.NegativeArraySizeException") 

} 
arrClass := componentClass.ArrayClass() 
arr := arrClass.NewArray(uint(count)) 
stack.PushRef (arr) 





上 面 的 代码 比较 容易 理解 ， 这 里 融 不 详细 解释 
了 。Class 结 构 体 的 ArrayClass〈) 方法 返回 与 类 对 
应 的 数组 类 ， 代 码 在 class.go 文 件 中 ， 如 下 所 示 : 





func (self *Class) ArrayClass() *Class { 
arrayClassName := getArrayClassName(self.name) 
return self.loader.LoadClass(arrayClassName) 


. 





先 根据 类 名 得 到 数组 类 名 ， 然 后 调用 类 加 载 右 
加 载 数组 类 即 可 。 在 ch08\rtda\heap 日 录 下 创建 


class_name_helper.go 文 件 ， 在 其 中 实现 
getArrayClassName 〈) 函数 ， 代 码 如 下 : 





package heap 
func getArrayClassName(className string) string { 
return "[" + toDescriptor(className) 





把 类 名 转变 成 类 型 描述 符 ， 然 后 在 前 面 加 上 方 
括号 即 可 。 在 class_name_helper.go 文 件 中 实现 
toDescriptor () 函数 ， 代 码 如 下 : 





func toDescriptor(className string) string { 
If className[0] == '[" { 
return className 


if d, ok := primitiveTypes[className|]; ok { 
return d 


return "L" + className + ";" 





如 果 是 数组 闫 名， 摘 述 符 束 是 闫 名， 直接 返回 
即 可 。 如 果 是 基本 类 型 名 ， 返 回 对 应 的 类 型 描述 


条， 否则 肯定 是 普通 的 类 名 ， 前 面 加 上 方 括号 ， 结 
尾 加 上 分 号 即 可 得 到 类 型 描述 符 。primitiveTypes 变 
量 也 在 class_name_helper.go 文 件 中 定义 ， 代 人 码 如 
下 : 


var primitiveTypes = map[string]stringt{ 

"yoid": “VD 
"boolean": ep 
"byte": ne 

"short": 5 

"Intu We 
"long": a a 
"char": “Ce 
"float": "FF", 
"double": "D"™, 





除了 newarray 和 anewarray， 还 有 一 个 
multianewarray 指 令 ， 专 门 用 来 创建 多 维 数组 。 这 个 
指令 比较 复杂 ， 放 到 最 后 实现 。 下 面 来 看 


arraylength 指 令 。 


8.3.3 arraylength 指 令 


arraylength 指 令 用 于 获取 数组 长 度 。 在 
ch08\instructions\references 目 录 下 创建 
arraylength.go， 在 其 中 定义 arraylength 指 令 ， 代 码 
好 下 : 





package references 

import "jvmgo/ch08/instructions/base" 

import "jvmgo/cho8/rtda" 

// Get length of array 

type ARRAY_LENGTH struct{ base.NoOperandsInstruction } 





arraylength 指 令 只 需要 一 个 操作 数 ， 即 从 操作 
数 栈 顶 弹出 的 数组 引用 。Execute〈) 方法 把 数组 长 
度 推 入 操作 数 栈 项 ， 代 码 如 下 : 





func (self *ARRAY_LENGTH) Execute(frame *rtda.Frame) { 


stack := frame.OperandStack() 
arrRef := stack.PopRef() 
if arrRef == nil { 


panic("java.lang.NullPointerException") 


} 
arrLen := arrRef.ArrayLength() 
stack.PushIint(arrLen) 
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如 果 数 组 引用 是 null， 则 需要 抛 出 
NullPointerException 异 香 ， 否 则 取 数 组 长 度 ， 推 入 
操作 数 栈 顶 即 可 。 下 面 实 现 <t>aload 和 <t>astore 系 


列 指令 。 


8.3.4 ”<t>aload 指 令 


<t>aload 系 列 指令 按时 引 取 数组 元 素 值 ， 人 然后 
推 入 操作 数 栈 。 在 ch08\instructionsNoads 目 录 下 创建 
xaload.go 文 件 ， 在 其 中 定义 8 条 指令 ， 代 码 如 下 : 





package loads 
import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 
import "jvmgo/cho8/rtda/heap" 


type 
type 
type 
type 
type 
type 
type 
type 





这 8 条 指令 的 实现 大 同 小 异 ， 为 了 节约 篇 幅 ， 


以 aaload 指 令 为 例 进 行 说 明 。 其 Execute 〈) 方法 如 


下 





AALOAD 
BALOAD 
CALOAD 
DALOAD 
FALOAD 
IALOAD 
LALOAD 
SALOAD 


structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 


base. 
base. 
base. 
base. 
base. 
base. 
base. 
base. 


NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 


AOA 


func (self *AALOAD) Execute(frame *rtda.Frame) { 


stack := frame.OperandStack() 
index := stack.PopInt() 
arrRef := stack.PopRef() 
checkNotNil(arrRef) 

refs := arrRef .Refs() 
checkIndex(len(refs), index) 
stack.PushRef(refs[index]) 


首先 从 操作 数 栈 中 弹出 第 一 个 操作 数 : 数组 索 
引 ， 然 后 弹出 第 二 个 操作 数 : 数组 引用 。 如 采 数 组 
引用 是 null， 则 抛 出 NullPointerException 异 负 。 这 个 


判断 在 checkNotNil () 函数 中 ， 人 代码 如 下 : 


func checkNotNil(ref *heap.0Object) { 
if ref == nil { 
panic("java.lang.NullPointerException") 


如 果 数 组 索引 小 于 0， 或 者 大 于 等 于 数组 长 
度 ， 则 抛 出 ArrayIndexOutOfBoundsException。 这 个 
检查 在 checkIndex《〈) 函数 中 ， 代 码 如 下 : 


func checkIndex(arrLen int, index int32) { 


if index < 0 || index >= int32(arrLen) { 
panlic("ArrayIndexoutofBoundsEXception'”) 


如 果 一 切 正 芝 ， 则 按 索 引 取 出 数组 元 系 ， 推 入 
操作 数 栈 项 。 


8.3.5 “<t>astore 指 令 


<t>astore 系 列 指令 按 索 引 给 数组 元 兹 赋值 。 在 
ch08\instructions\stores 目 录 下 创建 xastore.go 文 件 ， 


在 其 中 定义 8 条 指令 ， 代 码 如 下 : 





package stores 
import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 
import "jvmgo/cho8/rtda/heap" 


type 
type 
type 
type 
type 
type 
type 
type 





这 8 条 指令 的 实现 是 大 同 小 异 ， 以 iastore 为 例 进 


AASTORE 
BASTORE 
CASTORE 
DASTORE 
FASTORE 
IASTORE 
LASTORE 
SASTORE 


structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 


base. 
base. 
base. 
base. 
base. 
base. 
base. 
base. 


NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 


行 说 明 ， 其 Execute () 方法 如 下 : 





ccc 一 


func (self *IASTORE) Execute(frame *rtda.Frame) { 


stack := frame.OperandStack() 
val := stack.PopInt() 
index := stack.PopInt() 


arrRef := stack.PopRef() 
checkNotNil(arrRef) 

ints := arrRef.Ints() 
checkIndex(len(ints), index) 
ints[index] = int32(val) 


iastore 指 令 的 三 个 操作 数 分 别 是 : 要 赋 给 数组 
元 素 的 值 、 数 组 索引 、 数 组 引用 ， 依 次 从 操作 数 栈 
中 弹出 。 如 果 数 组 引用 是 null， 则 抛 出 
NullPointerException。 如 果 数 组 索引 小 于 0 或 者 大 于 
等 于 数组 长 度 ， 则 抛 出 
ArrayIndexOutOfBoundsException 异 常 。 这 两 个 检查 
和 <t>aload 系 列 指令 一 样 。 如 果 一 切 正 常 ， 则 按 索 
引 给 数组 元 素 赋 值 。 





<t>aload 和 <t>astore 指 令 实 现 好 了 ， 下 面 来 看 


multianewarray 指 令 。 


8.3.6 ”mnultianewarray 指 令 


multianewarray 指 令 创建 多 维 数组 。 在 
ch08\instructions\references 目 录 下 创建 
multianewarray.go 文 件 ， 在 其 中 定义 multianewarray 
指令 ， 代 人 码 如 下 所 示 : 





package references 
import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 
import "jvmgo/cho8/rtda/heap" 
// Create new multidimensional array 
type MULTI_ANEW ARRAY struct { 

index uint16 

dimensions uint8 


| 








multianewarray 指 令 的 第 一 个 操作 数 是 个 uint16 
索引 ， 通 过 这 个 索引 可 以 从 运行 时 常量 池 中 找到 一 
个 类 符号 引用 ， 解 析 这 个 引用 就 可 以 得 到 多 维 数组 


类 。 第 二 个 操作 数 是 个 uint8 整 数 ， 表 示 数 组 维度 。 





这 两 个 操作 数 在 字 市 码 中 紧 跟 在 指令 操作 人 码 后 面 ， 
由 FetchOperands () 方法 读 取 ， 代 人 码 如 下 : 





func (self *MULTI_ANEW ARRAY) Fetchoperands(reader *base.Bytec 
self.index = reader.ReadUint16() 
self.dimensions = reader.ReadUint8() 


} 





multianewarray 指 令 还 需要 从 操作 数 栈 中 弹出 n 
个 整数 ， 分 别 代 表 每 一 个 维度 的 数组 长 度 。 
Execute〈) 方法 根据 数组 类 、 数 组 维度 和 各 个 维度 
的 数组 长 度 创 建 多 维 数 组 ， 代 码 如 下 : 





func (self *MULTI_ANEW_ARRAY) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool() 


classRef := cp.GetConstant(uint(self.index)).(*heap.ClassRe 
arrClass := classRef.ResolvedClass() 

stack := frame.OperandStack() 

counts := popAndCheckCounts(stack, int(self.dimensions)) 
arr := newMultiDimensionalArray(counts, arrClass) 
stack.PushRef (arr) 








这 里 提醒 读者 注意 ， 在 anewarray 指 令 中 ， 解 析 


类 符号 引用 后 得 到 的 是 数组 元 素 的 类 ， 而 这 里 解析 
出 来 的 直接 就 是 数组 类 。popAndCheckCounts () 
函数 从 操作 数 栈 中 弹出 n 个 int 值 ， 并 且 确 保 它 们 都 
大 于 等 于 0。 如 果 其 中 任何 一 个 小 于 0， 则 抛 出 
NegativeArraySizeException 异 常 。 代 码 如 下 : 





func popAndCheckCounts(stack *rtda.OperandStack, dimensions in 
counts := make([]int32, dimensions) 
for i := dimensions - 1; i >= 0; i-- { 
counts[i] = stack.PopInt() 
If counts[i] <0f{ 
panic("java.lang.NegativeArraySizeException") 


} 


return counts 


ly 





newMultiArray〈) 函数 创建 多 维 数组 ， 代 人 码 如 
下 : 





func newMultiDimensionalArray(counts [|]int32, arrClass *heap.c 
count := uint(counts[0]) 
arr := arrClass,NewArray(count ) 
If len(counts) >11{ 
refs := arr.Refs() 
for i := range refs { 
refs[i] = newMultiDimensionalArray (counts[1:], arrCcl 


} 


return arr 
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Class 结 构 体 的 ComponentClass () 方法 返回 数 
组 类 的 元 素 类 型 在 array_class.go 文 件 中 ， 代 码 如 
下 : 





func (self *Class) ComponentClass() *Class { 
componentClassName := getComponentClassName(self.name) 
return self.loader.LoadClass(componentClassName) 


} 





ComponentClass〈) 方法 先 根据 数组 类 名 推测 
出 数组 元 系 关 名 ， 然 后 用 类 加 载 右 加 载 元 又 类 即 
可 。getComponentClassName 〈) 函数 在 
ch08\rtda\heap\class_name_helper.go 文 件 中 ， 代 码 如 
下 : 





func getComponentClassName(className string) string { 
If className[0] == '[' { 
componentTypeDescriptor := className[1:] 


return toClassName(componentTypeDescriptor) 
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panic("Not array: " + className) 
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数组 类 名 以 方 括号 开头 ， 把 它 去 掉 驶 是 数组 元 
系 的 类 型 描述 符 ， 然 后 把 类 型 描述 符 转 成 类 名 即 
可 。toClassName 〈) 函数 也 在 class_name_helper.go 
文件 中 ， 代 码 如 下 : 





func toClassName(descriptor string) String { 
If descriptor[0] == '[' { // array 
return descriptor 
} 
if descriptor[0] == 'L' { // object 
return descriptor[1 : len(descriptor)-1] 


for className, d := range primitiveTypes { 
if d == descriptor { // primitive 
return className 


} 


panic("Invalid descriptor: " + descriptor ) 





如 果 闫 型 描述 符 以 方 括号 开头 ， 那 么 肯定 古 数 
组 ， 描 述 符 即 是 闫 名。 如 果 关 型 描述 符 以 L 开 头 ， 


痛 定 是 类 描述 符 ， 去 挤 开 头 的 L 和 末尾 的 分 号 
即 是 类 名 ， 人 否则 判断 是 否 是 基本 关 型 的 摘 述 符 ， 如 
条 是 ， 返 回 基本 类 型 名 称 ， 人 否则 调用 panic〈) 函数 
终止 程序 执行 。 


至 此 ，mnultianewarray 终 于 解释 完了 。 由 于 该 
指令 比较 难 理解 ， 用 一 个 例子 分 析 。 


public void test() { 
int[][][] x = new int[3][4][05]， 


上 面 的 Java 方 法 创建 了 一 个 三 维 数组 ， 编 译 之 
后 的 字 节 但 如 下 : 


00 Iconst_3 

01 Iconst_4 

02 Iconst_5 

03 multianewarray #5 // [[[I, 3 
07 astore 1 

08 return 


编译 器 先生 成 了 三 条 iconst_n 指 令 ， 然 后 又 生 
成 了 一 条 multianewarray 指 令 ， 剩 下 的 两 条 指令 和 数 
组 创建 无 关 。multianewarray 指 令 的 第 一 个 操作 数 是 
5， 是 个 类 引用 ， 类 名 是 [[[I， 说 明 要 创建 的 是 int[][] 
数组。 第 二 个 操作 数 是 3， 说 明 要 创建 三 维 数组 。 





当 方 法 执行 时 ， 三 条 iconst_n 指 令 先后 把 整数 
3、4、5 推 入 操作 数 栈 顶 。mnultianewarray 指 令 在 解 
码 时 就 已 经 拿 到 常量 池 索 引 (5) 和 数组 维度 
(3) 。 在 执行 时 ， 它 先 查 找 运行 时 常量 池 索 引 ， 
知道 要 创建 的 是 int[]UDD 数 组 ， 接 着 从 操作 数 栈 中 弹 
出 三 个 int 值 ， 依 次 是 5、4、3。 现 在 multianewarray 
指令 拿 到 了 全 部 信息 ， 从 最 外 维 开 始 创 建 数组 实例 
印 可 。 








专门 用 于 数组 的 指令 实现 好 了 ， 但 别 忘 了 还 需 


要 修改 ch08\instructions\factory. A 在 其 中 添加 
这 些 指令 的 case 语 句 。 改 动 比 较 简 单 ， 这 里 就 不 给 
出 代码 了 。 下 面 修改 instanceof 和 checkcast， 让 这 两 
条 指令 可 以 正确 用 于 数组 对 象 。 


8.3.7 ”完善 instanceof 和 checkcast 指 今 


虽然 说 是 完善 instanceof 和 checkcast 指 令 ， 但 实 
际 上 这 两 条 指令 的 代码 都 没有 任何 变化 。 需 要 修改 
的 是 ch08\rtda\heap\class_hierarchy.go 文 件 中 的 
isAssignableFrom 〈) 方法 ， 而 且 改 动 很 大 ， 代 码 如 
下 : 





func (self *Class) isAssignableFrom(other *Class) bool { 
s, t := other, self 
if s == tt{ 
return true 


} 
If !S.ISArray() { 
if !s.IsInterface() { 
If !t.ISInterface() { 
return s.IsSubclassof(t) 
} else { 
return s.IsImplements(t) 


} 
} else { 
if !t,ISInterface() { 
return t.isJl0Object() 
} else { 
return t.isSuperIinterfaceOof(s) 


} 


} 
} else { 
If It.ISArray() { 


If !t.ISInterface() { 
return t,1sJLIobject() 


} else { 
return t.isJlCloneable() || t.isJioSerializable() 
} 
} else { 
sc := S.ComponentClass() 
tc := t.ComponentClass() 
return sc == tc || tc.isAssignableFrom(sc) 
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return false 








注意 ， 粗 体 部 分 是 原来 的 代码 ， 其 余 都 是 新 增 
代码 。 由 于 篇 幅 限 制 ， 束 不 详细 解释 这 个 函数 了 ， 
请 读者 阅读 Java 虚 拟 机 规范 的 8.6.5 节 对 instanceof 和 


checkcast 指 令 的 摘 述 。 需 要 注意 的 是 : 


` 数组 可 以 强制 转换 成 Object 类 型 (因为 数组 
的 超 类 是 Object) 


. 数组 可 以 强制 转换 成 Cloneable 和 Setializable 类 
型 (因为 数组 实现 了 这 两 个 接口 ) 。 


如 果 下 面 两 个 条 件 之 一 成 立 ， 类 型 为 [SC 的 
数组 可 以 强制 转换 成 类 型 为 |IC 的 数组 : 


和 TC 和 和 SC 是 同 一 个 基本 类 型 Oo 


- TC 和 SC 都 是 引用 类 型 ， 且 SC 可 以 强制 转 
换 成 TC。 


8.4 测试 数组 


数组 相关 的 内 容 兰 不 多 者 准备 好 了 ， 下 面 用 经 
典 的 冒 泡 排 序 算 法 测试 。 





package jvmgo.book.cho8 ; 
public class BubbleSortTest { 
public static void main(String[|] args) { 
int[] arr = {22, 84, 77, 11, 95, 9, 78, 56, 36, 97, 65, 
bubbleSort(arr); 
printArray(arr); 
} 
private static void bubbleSort(int[] arr) { 
boolean swapped = true; 
int j] = 0; 
int tmp; 
while (swapped) { 
swapped = false; 
j++; 
for (int i = 0; i < arr.length - j; i++) { 
if (arr[i] > arr[i + 1]) { 
tmp = arr[il]; 
arr[i] = arr[i + 11]; 
arr[i + 1|] = tmp; 
swapped = true; 


} 
+ 
private static void printArray(int[] arr) { 
for (int i : arr) { 
System.out.println(1i); 


} 





打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 代 
码 : 





go install jvmgo\ch08 





命令 执行 完毕 后 ， 在 D: \go\workspace\bin 目 录 
下 出 现 ch08.exe 文 件 。 用 javac 编 译 ， 然 后 用 ch08.exe 
执行 BubbleSortTest 类 ， 结 果 如 图 8-1 所 示 。 


D:\go\workspace\bin>ch08,. exe -Xjre C:\Program Files\Java\ijrel, 8.0 .66”jvmgo, boola 
k. ch08. BubbleSortTest 





图 8-1 BubbleSortTest 程 序 执行 结果 


8.5 字符 串 





在 class 文 件 中 ， 字 符 串 是 以 MUTF8 格 式 保存 
的 ， 这 一 点 在 3.3.7 节 讨论 过 。 在 Java 虚 拟 机 运行 其 
间 ， 字 符 串 以 java.lang.String (后 面 简称 String)〉 对 
象 的 形式 存在 ， 而 在 String 对 象 内 部 ， 字 符 串 又 是 
以 UTF16 格 式 保存 的 。 字 符 串 相关 功能 大 部 分 都 是 
由 String (和 StringBuilder 等 ) 类 提供 的 ， 本 节 只 
现 一 些 辅助 功能 即 可 。 





String 类 有 两 个 实例 变量 。 其 中 一 个 是 value， 
类 型 是 字符 数组 ， 用 于 存放 UTF16 编 码 后 的 字符 序 
列 。 另 一 个 是 hash， 绥 存 计 字符 串 的 哈 希 码 ， 代 三 
如 下 : 











package java.1lang; 


public final class String 
implements java.io.Serializable, Comparable<String>, Charse 
/** The value is used for character storage. */ 
private final char valuel[|]; 
/** Cache the hash code for the string */ 
private int hash; // Default to 0 
，// 其 他 代码 








字符 串 对 象 是 不 可 变 (immutable) 的 ,一 旦 
构造 好 之 后 ， 束 无 法 再 改变 其 状态 《〈 这 里 指 value 字 
段 )。String 类 有 很 多 构造 函数 ， 其 中 一 个 是 根据 
字符 数组 来 创建 String 实 例 ， 代 码 如 下 : 

public String(char value[]) { 


this.value = Arrays.copyOof(value, value.1length); 


} 








本 市 将 参考 上 面 的 构造 函数 ， 直 接 创建 String 
实例 。 为 了 节约 内 存 ，Java 虚 拟 机 内 部 维护 了 一 个 
字符 串 池 。String 类 提供 了 intem〈) 实例 方法 ， 可 
以 把 自己 放 入 字符 串 池 。 代 码 如 下 : 


public native String intern( ) 





本 节 将 实现 字符 串 池 ， 由 于 intern() 是 本 地 
方法 ， 所 以 留 到 第 9 章 实 现 。 


8.5.1 ”字符 串 池 


在 ch08\rtda\heap 目 录 下 创建 string_pool.go 文 
件 ， 在 其 中 定义 internedStrings 变 量 ， 代 码 如 下 : 





package heap 
import "unicode/utf16" 
var internedStrings = map[string]*Object{} 





用 map 来 表示 字符 串 池 ，key 是 Go 字符 串 ， 
value 是 Java 字 符 串 。 继 续 编 辑 string_pool.go 文 件 ， 
在 其 中 实现 JString() 隐 数 ， 代 人 码 如 下 : 





func JString(loader *ClassLoader, goStr string) *Object { 

If internedStr，ok := internedSstrings[goSstr]; ok { 
return internedstr 

} 
chars := StringToUtf16(goStr ) 
jChars := &Object{loader.LoadClass("[C"), chars} 
JStr := loader.LoadClass("java/lang/String").NewObject() 
JStr.SetRefVar("value", "[C", jChars) 
internedStrings[goStr] = jStr 
return jStr 


JString () 函数 根据 Go 字符 串 返 回 相 应 的 Java 
字符 串 实 例 。 如 果 Java 字 符 串 已 经 在 池 中 ， 直 接 返 
回 即 可 ， 否 则 先 把 Go 字符 串 (UTF8 格 式 〉 转 换 成 
Java 字 符 数 组 (UTF16 格 式 ) ， 然 后 创建 一 个 Java 
字符 串 实例 ， 把 它 的 value 变 量 设置 成 刚刚 转换 而 来 
的 字符 数组 ， 最 后 把 Java 字 符 串 放 入 池 中 。 注 意 ， 
这 里 其 实 是 跳 过 了 String 的 构造 函数 ， 直 接 用 hack 
的 方式 创建 实例 。 在 前 面 分 析 过 String 类 的 代码 ， 
这 样 做 虽然 有 点 投机 取 巧 ， 但 确实 是 没有 问题 的 。 

















继续 编辑 string_pool.go 文 件 文 件 ， 实 现 
stringToUtf16 〈) 函数 ， 人 代码 如 下 : 


func stringToUtf16(s string) [juint16 { 
runes := [J]rune(s) // utf32 
return utf16.Encode(runes) 
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Go 语言 字符 串 在 内 存 中 是 UTF8 编 码 的 ， 先 把 
它 强 制 转 成 UTF32， 然 后 调用 utf16 包 的 Encode () 
函数 编码 成 UTF16。Object 结 构 体 的 SetRefVar () 
方法 直接 给 对 象 的 引用 类 型 实例 变量 赋值 ， 代 码 如 





下 《在 object.go 文 件 中 ) : 


func (self *Object) SetRefVar(name，descriptor string, ref *0b 
field := self.class.getField(name, descriptor, false) 
slots := self.data.(Slots) 
slots.SetrRef(field.slotIid, ref) 


3 


Class 结 构 体 的 getField () 函数 根据 字段 名 和 
摘 述 符 查 找 字 段 ， 代 码 如 下 (代码 在 class.go 文 件 


func (self *Class) getField(name, descriptor string, isStatic) 
for c := self; c != nil; c = c.superClass { 
for _, field := range c.fields { 
if field.IsStatic() == isStatic && 
field.name == name && field.descriptor == descript 


return field 


return nil 





字符 串 池 实 现 好 了 ， 下 面 修改 ldc 指 令 和 类 加 载 
船 ， 让 它们 文 持 字 符 串 。 








8.5.2 ”完善 dc 指令 


打开 ch08\instructions\constants\ldc.go 文 件 ， 湛 
加 一 条 import 语 句 ， 代 人 码 如 下 : 





package constants 

import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 

import "jvmgo/cho8/rtda/heap" 





然后 修改 Jdc〈) 函数 ， 改 动 如 下 : 





func _ldc(frame *rtda.Frame, index uint) { 

stack := frame.OperandSstack() 

class := frame.Method().Class() 

c := class.ConstantPool().GetConstant(index) 

Switch c.(type) { 

case int32: stack.PushIint(c. (int32)) 

case float32: stack.PushFloat(c. (float32)) 

case string: 
internedStr := heap.JString(class.Loader(), c.(string)) 
stack.PushRef(internedSstr) 
，// 其 他 代码 不 变 








如 果 ]1dc 试 图 从 运行 时 常量 池 中 加 载 字 符 串 第 
量 ， 则 先 通过 常量 拿 到 Go 字符 串 ， 然 后 把 它 转 成 
Java 字 符 串 实例 并 把 引用 推 入 操作 数 栈 顶 。 





8.5.3 “完善 类 加 载 器 


打开 ch08\rtda\heap\class_loader.go 文 件 ， 修 改 
initStaticFinalVar 函 数 ， 改 动 如 下 : 





func initStaticFinalVar(class *Class, field *Field) { 

vars := class.staticVars 

cp := class.constantPool 

cpIndex := field.ConstValueIndex() 

SlotId := field.SlotId() 

If cpIndex > 0 { 

Switch field.Descriptor() { 
，// 其 他 


CaSe 语 名 不 变 


case "Ljava/lang/String;": 
goStr := cp.GetConstant(cpIndex).(string) 
JStr := JString(class.Loader(), gostr) 
vars.SetRef(slotId, jsStr) 
} 
+ 
} 











这 里 增加 了 字符 串 类 型 静态 常量 的 初始 化 远 
辑 ， 人 代码 比较 简单 ， 就 不 多 解释 了 。 至 此 ， 字 符 吓 


相关 的 工作 都 做 完了 ， 下 面 进行 测试 。 





8.6 测试 字符 串 


打开 ch08\main.go 文 件 ， 修 改 starUJVM () 函 
数 。 改 动 非 常 小 ， 只 是 在 调用 interpret () 函数 
时 ， 把 传递 给 Java 主 方法 的 参数 传递 给 它 ， 代 人 码 如 
下 : 





func startJVM(cmd *Cmd) { 
: // 其 他 代码 不 变 


if mainMethod != nil { 
interpret(mainMethod, cmd.verboseInstFlag, cmd.args) 
} else { 
fmt.Printf("Main method not found in class %s\n", cmd.cl 
} 
} 





打开 interpreter.go 文 件 ， 修 改 interpret() 疗 





func interpret(method *heap.Method, logInst bool, args [lstrin 
thread := rtda,NewThread () 


frame := thread.NewFrame(method ) 
thread.PushFrame(frame) 

JArgs := createArgsArray(method.Class().Loader(), args) 
frame.LocalVars().SetrRef(0, jArgs) 

defer catchErr(thread) 

loop(thread, logInst) 





interpret () 函数 接收 从 starJVM 〈) 函数 中 传 
递 过 来 的 args 参 数 ， 然 后 调用 createArgs-Array () 
函数 把 它 转 换 成 Java 字 符 串 数组 ， 最 后 把 这 个 数组 
推 入 操作 数 栈 顶 。 至 此 ， 通 过 命令 行 传递 给 Java 程 
序 的 参数 终于 可 以 派 上 用 场 了 ! 
createArgsArray〈) 函数 的 代码 如 下 : 





func createArgsArray(loader *heap.ClassLoader, args [jstring) 
stringClass := loader.LoadClass("java/lang/String") 


argsArr := stringClass.ArrayClass().NewArray(uint(len(args) 
JArgs := argsArr.Refs() 
for i, arg := range args { 


JArgs[i] = heap.JString(loader, arg) 


return argsArr 





最 后 ， 打 开 


ch0O8\instructions\references\invokevirtual.go， 修 改 
_println《) 叉 数 ， 让 它 可 以 打印 字符 串 ， 改 动 如 
下 : 








// hack! 
func _println(stack *rtda.OperandStack, descriptor string) { 
switch descriptor { 
，// 其 他 


CaSe 语 名 不 变 


case "(Ljava/lang/String;)V": 
JStr := stack.PopRef() 
goStr := heap.GoString(jSstr) 
fmt.Println(gostr) 
， // 其 他 代码 不 变 





GoString〈) 函数 在 string_pool.go 文 件 中 ， 代 
人 码 如 下 : 





func GoString(jStr *Object) string { 
charArr := JjStr.GetRefVar("value", "[C") 
return utf1i6ToString(charArr.chars()) 

} 


先 拿 到 String 对 象 的 value 变 量 值 ， 然 后 把 字符 
数组 转换 成 Go 字符 串 。Object 结 构 体 的 
GetRefVar() 方法 〈 在 object.go 文 件 中 ) 如 下 : 


func (self *Object) GetRefVar(name, descriptor string) *Object 
field := self.class.getField(name, descriptor, false) 
slots := self.data.(Slots) 
return slots.GetRef(field.slotId) 

让 


utf16ToString 〈() 函数 在 string_pool.go 文 件 


func utf1i6ToString(s [J]Juint16) String { 
runes := utf16.Decode(s) // utf8 
return string(runes) 


} 


先 把 UTF16 数 据 转 换 成 UTF8 编 码 ， 然 后 强制 
转换 成 Go 字符 串 即 可 。 一 切 就 绪 ! 重新 编译 本 章 代 
人 码 ， 然 后 用 ch08.exe 执 行 在 第 1 章 束 已 经 出 现 过 的 


HelloWorld 程 序 。 





package jvmgo.book.cho1; 
public class Helloworld { 
public static void main(String[] args) { 
System.out.println("Hello, world!"); 
} 


} 





久违 的 “Hello，world! ”终于 出 现在 控制 台 上 
了 ， 如 图 8-2 所 示 。 


D:\go\workspace\bin>ch08. exe -Xire ‘C:\Program Files\Java\irel. 8.0 66”jvmgo. boolB 
k. ch01. Helloyorld 
Hello, world! 





D:\go\workspace\bin> 


图 8-2 HelloWotrld 程 序 执 行 结果 


再 执行 一 个 稍微 复杂 一 些 的 程序 : 





package jvmgo.book.cho8 ; 
public class PrintArgs { 
public static void main(String[] args) { 
for (String arg : args) { 
System.out.println(arg); 
} 





执行 结果 如 图 8-3 所 示 。 





\workspace\bin>ch08, exe -Xijre C:\Program Files\Java\irel.8.0 66 jvmgo. boola 
Sp 2 Dh | 
.PrintArgs foo bar 你 好 ， 世 界 ! | 


D:\go\workspace\bin> Y | 


图 8-3 ”PrintArgs 程 序 执行 结果 


8.7 本章 小 结 


本 草 实 现 了 数组 和 字符 串 ， 在 本 草 的 结尾 ， 终 
于 可 以 运行 HelloWotrld 程 序 了 。 不 过 美中不足 的 
是 ， 我 们 并 不 是 通过 调用 System.out.ptinttn () 方 
法 ， 而 是 通过 hack 的 方式 打印 的 。 请 读者 不 要 着 
和 急 ， 下 一 章 会 讨论 本 地 方法 调用 ， 第 10 章 会 讨论 异 
常 处 理 。 到 了 第 11 章 ， 将 最 终 去 掉 这 个 hack， 让 


println () 方法 真正 得 以 调用 ! 


第 9 章 ”本 地 方法 调用 


在 前 面 的 8 章 里 ， 我 们 一 直 在 实现 Java 虚 拟 机 的 
基本 功能 。 我 们 已 经 知道 ， 要 想 运行 Java 程 序 ， 除 
了 Java 虚 拟 机 之 外 ， 还 需要 Java 类 库 的 配合 。Java 虚 
拟 机 和 Java 类 库 一 起 构成 了 Java 运 行 时 环境 。Java 类 
库 主 要 用 Java 语 言 编 写 ， 一 些 无 法 用 Java 语 言 实现 的 
方法 则 使 用 本 地 语言 编写 ， 这 些 方法 叫 作 本 地 方 
法 。 从 本 划 开 始 ， 将 陆续 实现 一 些 Java 类 库 中 的 本 
地 方法 。 


OpenJDK 类 库 中 的 本 地 方法 是 用 JNI (Java 
Native Intetface) 由 编写 的 ， 但 是 要 让 虚拟 机 支持 
JNI 规 范 还 需要 做 大 量 的 工作 。 由 于 本 书 的 主要 目 
的 是 介绍 Java 虚 拟 机 的 工作 原理 ， 为 了 不 陷入 JNI 规 


范 的 细节 之 中 ， 将 使 用 Go 语言 来 实现 这 些 方法 。 


开始 编写 代码 之 前 ， 还 是 先 把 目录 结构 准备 
好 。 复 制 ch08 目 录 ， 改 名 为 ch09。 修 改 main.go 等 文 
件 ， 把 impott 语 多 中 的 ch08 全 都 替换 成 ch09。 在 ch09 
目录 下 创建 native 子 目录 ， 本 章 新 增 的 go 文件 主要 都 
在 这 个 目录 〈 和 它 的 子 目 录 ) 中 。 现 在 ， 目 录 结 构 
看 起 来 是 下 面 这 个 样子 : 


D:\go\workspace\src 
| -jvmgo 
| -cho1 ~ cho8 
|-cho9 
-classfile 
-classpath 
-instructions 
-native 
-rtda 
| -cmd ,go 
| -Interpreter .go 
| -main ,go 


[1 


http:/ /docs.oracle.com/javase/ 8/docs/technotes/ guides 


9.1 注册 和 查找 本 地 方法 








在 开始 实现 本 地 方法 之 前 ， 先 实现 一 个 本 地 方 
法 注册 表 ， 用 来 注册 和 查找 本 地 方法 。 在 
ch09native 目 录 下 创建 registry.go， 先 在 其 中 定义 
NativeMethod 类 型 和 registry 变 量 ， 代 码 如 下 : 


package native 

import "jvmgo/cho9/rtda" 

type NativeMethod func(frame *rtda.Frame) 
var registry = map[string]lNativeMethod{} 





把 本 地 方法 定义 成 一 个 函数 ， 参 数 是 Frame 绽 
构 体 指针 ， 没 有 返回 值 。 这 个 frame 参 数 就 是 本 地 
方法 的 工作 空间 ， 也 驶 是 连接 Java 虚 拟 机 和 Java 关 
库 的 桥 妆 ， 后 面 会 看 到 它 是 如 何 发 挥 作用 的 。 
registry 变 量 是 个 哈 硕 表 ， 值 是 具体 的 本 地 方法 实 














现 。 那 么 键 是 什么 呢 ? 继续 编辑 registry.go 文 件 ， 
在 其 中 实现 Register () 函数 ， 代 人 码 如 下 : 





func Register(className, methodName, methodDescriptor string, 
key := className + "~" + methodName + "~" + methodDescripto 
registry[key] = method 





类 名 、 方 法 名 和 方法 描述 符 加 在 一 起 才能 唯一 
确定 一 个 方法 ， 所 以 把 它们 的 组 合作 为 本 地 方法 注 
册 表 的 键 ，Register 〈) 函数 把 前 述 三 种 信息 和 本 
地 方法 实现 关联 起 来 。 继 续 编辑 registry.go 文 件 ， 
在 其 中 实现 FindNativeMethod () 方法 ， 代 码 如 
下 : 








func FindNativeMethod(className, methodName, methodDescriptor 
key := className + "~" + methodName + "~" + methodDescripto 
If method, ok := registry[key]; ok { 
return method 
} 
If methodDescriptor == "()V" && methodName == "registerNati 
return emptyNativeMethod 


return nil 


FindNativeMethod〈) 方法 根据 类 名 、 方 法 名 
和 方法 描述 符 查 找 本 地 方法 实现 ， 如 果 找 不 到 ， 则 
返回 nil。 第 7 章 结 尾 提 到 过 ，jva.lang.Object 等 类 是 
通过 一 个 叫 作 registerNatives 〈() 的 本 地 方法 来 注册 
其 他 本 地 方法 的 。 在 本 章 和 后 面 的 章节 中 ， 将 上 自己 
注册 所 有 的 本 地 方法 实现 。 所 以 像 
registerNatives ( ) 这 样 的 方法 瓯 没有 太 大 的 用 处 。 
为 了 避免 重复 代码 ， 这 里 统一 处 理 ， 如 果 遇 到 这 样 
的 本 地 方法 ， 就 返回 一 个 空 的 实现 ， 代 码 如 下 : 








func emptyNativeMethod(frame *rtda.Frame) { 
// do nothing 
} 


本 地 方法 注册 表 准 备 好 了 ， 下 面 介绍 如 何 调 用 
本 地 方法 。 


9.2 ”调用 本 地 方法 


第 7 章 用 一 段 hack 代 码 来 跳 过 本 地 方法 的 执 
行 。 现 在 ， 终 于 可 以 把 这 段 代 码 删除 了 ! 编辑 
ch09\instructions\base\method_invoke_logic.go， 把 
fmt 包 的 导入 语句 和 InvokeMethod () 函数 中 的 hack 
代码 删除 。 为 了 节约 篇 幅 ， 这 里 就 不 给 出 代码 了 。 











Java 虚 拟 机 规范 并 没有 规定 如 何 实现 和 调用 本 
地 方法 ， 这 给 了 我 们 充分 的 空间 来 发 挥 自己 的 想象 
力 。 读 者 很 快 束 会 看 到 ， 我 们 将 利用 Java 虚 拟 机 栈 
执行 本 地 方法 ， 所 以 除了 删除 上 面 的 
InvokeMethod〈) 函数 中 的 hack 代 码 之 外 ， 不 用 做 
任何 修改 。 


但 是 ， 本 地 方法 并 没有 字 市 码 ， 如 何 利用 Java 


虚拟 机 栈 来 执行 呢 ? Java 虚 拟 机 规范 预 留 了 两 条 指 
令 ， 操 作 码 分 别 是 0xFE 和 0xFF。 下 面 将 使 用 0xFE 
指令 来 达到 这 个 目的 。 打 开 
ch09\rtda\heap\method.go 文 件 ， 修 改 

newMethods () 水 数 ， 改 动 如 下 : 





func newMethods(class *Class, cfMethods [J]*classfile.MemberInf 
methods := make([]*Method, len(cfMethods)) 
for i, cfMethod := range cfMethods { 
methods[i] = newMethod(class, cfMethod) 
} 


return methods 





为 了 避免 newMethods () 函数 变 得 太 长 ， 我 们 
抽取 出 一 个 newMethod () 函数 ， 代 码 如 下 : 





func newMethod(class *Class, cfMethod *classfile.MemberInfo) * 
method := &Methodf{} 
method.class = class 
method.copyMemberInfo(cfMethod ) 
method.copyAttributes(cfMethod ) 
md := parseMethodDescriptor(method .descriptor ) 
method.calcArgSlotCount (md ,parameterTypes ) 
if method,ISNative() { 

method.injectCodeAttribute(md.returnType) 

} 


return method 


} 





粗 体 部 分 需要 解释 一 下 : 先 计算 argSlotCount 
字段 ， 如 果 是 本 地 方法 ， 则 注入 季节 人 码 和 其 他 信 
息 。 继 续 编辑 method.go 文 件 ， 添 加 
injectCodeAttribute 〈) 方法 ， 代 码 如 下 : 








func (self *Method) injectCodeAttribute(returnType String) { 
self.maxStack = 4 
self.maxLocals = self.argSlotCount 
switch returnType[0] { 
case 'V': self.code = []byte{Oxfe, Oxb1} // return 
case 'D': self.code = [|]byte{Oxfe, Oxaf} // dreturn 
case 'F': self.code = [|]byte{Oxfe, Oxae} // freturn 
case 'J': self.code = [|]byte{Oxfe, Oxad} // lreturn 
case 'L', '[': self.code = []byte{Oxfe, Oxb0} // areturn 
default: self.code = []byte{Oxfe, Oxac} // ireturn 
} 





本 地 方法 在 class 文 件 中 没有 Code 属 性 ， 所 以 需 
要 给 maxStack 和 maxLocals 字 段 赋值 。 本 地 方法 帆 
的 操作 数 栈 至 少 要 能 容纳 返回 值 ， 为 了 简化 代码 ， 
暂时 给 maxStack 字 段 赋值 为 4。 因 为 本 地 方法 帧 的 


局 部 变量 表 只 用 来 存放 参数 值 ， 所 以 把 
argSlotCount 赋 给 maxLocals 字 段 刚 好 。 至 于 code 字 
段 ， 也 就 是 本 地 方法 的 字 节 人 码 ， 第 一 条 指令 都 是 
0xFE， 第 二 条 指令 则 根据 函数 的 返回 值 选择 相应 的 
返回 指令 。 





另外 ， 由 于 把 方法 摘 述 符 的 解析 挪 到 了 
newMethod () 了 水 数 中 ， 所 以 calcArgSlotCount () 
方法 也 稍微 有 些 变 化 (增加 了 一 个 参数 ) ， 变 动 如 
下 : 


func (self *Method) calcArgSlotCount(paramTypes [jstring) { 
for _, paramType := range paramTypes { 
,'，// 其 他 代码 不 变 


下 面 我 们 来 实现 0xFE 指 令 。 在 ch09\instructions 





目录 下 创建 reserved 子 目录 ， 然 后 在 该 目录 下 创建 
invokenative.go 文 件 ， 在 其 中 定义 0xFE (后 面 称 之 
为 invokenative ) 指令 ， 代 人 码 如 下 : 





package reserved 

import "jvmgo/cho9/instructions/base" 

import "jvmgo/cho9/rtda" 

import "jvmgo/cho9/native" 

type INVOKE_ NATIVE struct{ base.NoOperandsInstruction } 








这 个 指令 不 需要 操作 数 ，Execute () 方法 的 代 
人 码 如 下 : 





func (self *INVOKE_NATIVE) Execute(frame *rtda.Frame) { 

method := frame.Method ( ) 

className := method.Class(),Name() 

methodName := method.Name() 

methodDescriptor := method.Descriptor() 

nativeMethod := native.FindNativeMethod(className, methodNa 

if nativeMethod == nil { 
methodInfo := className + "." + methodName + methodDescr 
panic("java.lang.UnsatisfiedLinkError: " + methodInfo) 


nativeMethod(frame ) 





根据 美 名 、 方 法 名 和 方法 描述 符 从 本 地 方法 注 





册 表 中 得 找 本 地 方法 实现 ， 如 条 找 不 到 ， 则 抛 出 
UnsatisfiedLinkError 寞 常 ， 耕 则 直接 调用 本 地 方 
法 。 最 后 ， 还 需要 修改 instructions\factory.go 文 件 ， 
在 其 中 添加 invokenative 指 令 的 case 语 句 ， 这 里 就 不 


给 出 代码 了 。 


现在 ， 万 事 俱 备 ， 只 欠 实 现 本 地 方法 ! 接 下 
来 ， 我 们 将 实现 Object 和 String 等 类 的 一 些 本 地 方 
法 。 在 后 面 几 重 中 ， 还 会 实现 更 多 的 本 地 方法 。 


9.3 ”反射 


Java 的 反射 机 制 十 分 强大 ， 本 贡 讨 论 的 内 容 只 
是 冰山 一 角 。 


9.3.1 类 和 对 象 之 间 的 关系 


在 Java 中 ， 类 也 表现 为 普通 的 对 象 ， 它 的 类 是 
java.lang.Class。 听 起 来 有 点 像 鸡 生 生还 是 禹 生 鸡 的 
问题 : 类 也 是 对 象 ， 而 对 象 又 是 类 的 实例 。 那 么 在 
Java 虚 拟 机 内 部 ， 客 竟 是 先 有 类 还 是 先 有 对 象 呢 ? 
下 面 就 来 一 探 完 苋 。 





如 前 所 述 ，Java 有 强大 的 反射 能 力 。 可 以 在 运 
行 期 间 获 取 类 的 各 种 信息 、 存 取 毅 态 和 实例 变量 、 
调用 方法 ， 等 等 。 要 想 运 用 这 种 能 力 ， 获 取 类 对 象 
中 是 第 一 步 。 在 Java 语 言 中 ， 有 两 种 方式 可 以 获得 
类 对 象 引用 : 使 用 类 字面 值 和 调用 对 象 的 
getClass〈) 方法 。 下 面 的 Java 代 人 码 演示 了 这 两 种 方 
Te 














System.out.println(String.class); 
System.out.println("abc".getClass()); 


在 第 6 章 中 ， 通 过 Object 结构 体 的 class 字 段 建立 
了 类 和 对 象 之 间 的 单 向 关系 。 现 在 把 这 个 关系 补充 
完整 ， 让 它 成 为 双 同 的 。 打 开 
ch09\rtda\heap\class.go 文 件 ， 修 改 Class 结 构 体 ， 添 
加 jClass 字 段 ， 改 动 如 下 : 





type Class struct { 
, ，// 其 他 字段 


jClass *0bject // java.lang.Class 实 例 





通过 jClass 字 上段， 每 个 Class 结 构 体 实例 都 与 一 





个 类 对 象 关 联 。 另 外 需要 给 jClass 字 段 定 义 Getter 方 
法 ， 人 代码 比较 简单 ， 束 不 给 出 了 。 下 面 打 开 








ch09\rtda\heap\object.go 文 件 ， 修 改 Object 结 构 体 ， 
湛 加 extra 字 段 ， 改 动 如 下 : 


type Object struct { 
class *Class 
data interface{} 
extra interface{} 





extra 字 段 用 来 记录 Object 结构 体 实例 的 额外 信 
恩 。 同 样 给 它 定 义 Getter 和 Setter 方 法 ， 这 里 残 不 给 
出 代码 了 。 这 个 字段 之 所 以 是 interface{} 类 型 ， 是 
因为 它 在 后 面 几 章 还 会 有 其 他 用 途 。 本 章 ， 只 用 它 
来 记录 类 对 象 对 应 的 Class 结 构 体 指针 。 





如 果 读 者 读 a 到 这 里 感觉 有 些 吃力 ， 请 不 要 怀疑 
自己 的 理解 能 力 ， 一 定 古 笔者 表达 得 不 够 好 。 男 
外 ， 笔 者 在 写 这 一 市 时 ， 目 己 也 是 犯 了 很 多 次 迷糊 
的 。 为 了 帮助 大 家 更 好 地 理解 类 和 对 象 之 间 的 关 





系 ， 让 我 们 想象 这 样 一 个 极 简化 的 Java 虚 拟 机 运行 
时 状态 : 方法 区 中 只 加 载 了 两 个 类 ， 
java.lang.Object 和 java.lang.Class; 堆 中 只 通过 new 指 


令 分 配 了 一 个 对 象 。 此 时 Java 虚 拟 机 的 内 存 状 态 如 
图 9-1 所 示 。 


Heap Method Area 






classl 
name: java.lang.Object 
object2 superClass 
JClass 








class2 
name: java.lang.Class 


superClass 
jClass 






图 9-1 类 和 对 象 关 系 图 


图 9-1 只 画 出 了 Class 和 Object 结构 体 的 必要 字 


段 ， 并 且 刻 意 分 开 了 扒 和 方法 区 。 在 方法 区 中 ， 
class1 和 class2 分 别 是 java.lang.Object 和 和 
java.lang.Class 类 的 数据 。 在 堆 中 ，objectl1 和 object2 
分 别 是 java.lang.Object 和 java.lang.Class 的 类 对 象 。 
object3 是 单独 的 java.lang.Object 实 例 。 虽 然 已 经 简 

头 ， 硕 望 有 密集 念 惧 


如 和 位 


专用] 


化 到 了 极点 ， 但 仍然 有 8 


症 的 读者 不 要 被 吓 倒 。 
上 在 本 书 中 ， 类 对 象 特 指 java.lang.Class 类 的 实例 ; 


对 象 泛 指 任何 类 的 实例 。 


9.3.2 ”修改 类 加 载 器 


Class 和 Object 结构 体 准 备 好 了 ， 接 下 来 修改 类 
加 载 器 ， 让 每 一 个 加 载 到 方法 区 中 的 类 都 有 一 个 类 
对 象 与 之 相关 联 。 打 开 
ch09\rtda\heap\class_loader.go 文 件 ， 修 改 
NewClassLoader( ) 函数 ， 改 动 如 下 : 





func NewClassLoader(cp *classpath.Classpath, verboseFlag bool) 
loader := &ClassLoadert{ 
cp: cp, 
verboseFlag: verboseFlag, 
classMap: make(map[string]*Class), 


loader.loadBasicClasses() 
return loader 


} 


在 返回 ClassLoader 结 构 体 实例 之 前 ， 先 调用 
loadBasicClasses 〈) 函数 。 这 个 函数 也 要 添加 到 
class_loader.go 文 件 中 ， 代 人 码 如 下 : 


nn | 


func (self *ClassLoader) loadBasicClasses() { 
jlClassClass := self.LoadClass("java/lang/Class") 
for _, class := range self.classMap { 
if class.jClass == nil { 
class.jClass = jlClassClass.NewObject() 
class.jClass.extra = class 
} 
} 
} 





loadBasicClasses 〈) 函数 先 加 载 java.lang.Class 
类 ， 这 又 会 触发 java.lang.Object 等 类 和 接口 的 加 
载 。 然 后 遍历 classMap， 给 已 经 加 载 的 每 一 个 类 关 

类 对 象 。 好 啦 ， 问 题 已 经 解决 了 一 半 。 下 面 修改 
LoadClass《〈) 方法 ， 解 决 男 一 半 问 题 。 改 动 较 大 ， 
代码 如 下 : 





func (self *ClassLoader) LoadClass(name string) *Class { 
if class, ok := self.classMap[name]; ok { 
return class // already loaded 


} 

var class *Class 

If name[0] == '[' { // array class 
class = self.loadArrayClass (name) 

} else { 


class = self.loadNonArrayClass (name) 


if jlClassClass, ok := self.classMap["java/lang/Class"]; ok 
class.jClass = jlClassClass.NewObject() 


class.jClass.extra = class 


return class 





主要 的 变动 是 狙 体 部 分 。 在 类 加 载 完 之 后 ， 看 
java.lang.Class 是 否 已 经 加 载 。 如 果 是 ， 则 给 类 关联 
类 对 象 。 这 样 ， 在 loadBasicClasses () 和 
LoadClass《〈) 方法 的 配合 之 下 ， 所 有 加 载 到 方法 区 
的 类 都 设置 好 了 jClass 字 段 。 


9.3.3 ”基本 类 型 的 类 


void 和 基本 类 型 也 有 对 应 的 类 对 象 ， 但 只 能 通 
过 字面 值 来 访问 ， 如 下 面 的 Java 代 人 码 所 示 。 





System.out. 
System.out. 
System.out. 
System.out. 
System.out. 
System.out. 
System.out. 
System.out. 
System.out. 


println(void.class); 
println(boolean.class); 
printJln(byte,class ) ; 
printJln(char ,class ) ; 
printlin(short.class); 
printJln(int.class ) ; 
printJln(long,class ) ; 
printJln(float.class) ，; 
println(double.class); 





和 数组 类 一 样 ， 基 本 类 型 的 类 也 是 由 Java 虚 拟 
机 在 运行 期 间 生 成 的 。 继 续 编 辑 class_loader.go 文 
件 ， 修 改 NewClassLoader () 函数 ， 在 其 中 添加 如 
下 二 全 代 人 5， 








func NewClassLoader(cp *classpath.Classpath, verboseFlag bool) 
: // 前 面 的 代码 不 变 


Loader ,LoadBasicClasses( ) 
loader.1loadPrimitiveClasses() 
return loader 





loadPrimitiveClasses () 方法 加 载 void 和 基本 类 
型 的 类 ， 代 码 如 下 : 





func (self *ClassLoader) loadPprimitiveClasses() { 
for primitiveType, _ := range primitiveTypes { 
self.loadPrimitiveClass(primitiveType) // primitiveTypex 


VOid、 


int、 


float 等 





生成 void 和 基本 类 型 类 的 代码 在 
loadPrimitiveClass 〈) 方法 中 ， 代 人 码 如 下 : 





func (self *ClassLoader) loadPrimitiveClass(className string) 


class := &Classt 


accessFlags: ACC_PUBLIC, 
name : className, 
loader: self, 
initStarted: true, 


class.jClass = self.classMap["java/lang/Class"].NewObject() 
class.jClass.extra = class 
self.classMap[className|] = class 





这 里 有 三 点 需要 说 明 。 第 一 ，void 和 基本 类 型 
的 类 名 就 是 void、int、float 等 。 第 二 ， 基 本 类 型 的 
类 没有 超 类 ， 也 没有 实现 任何 接口 。 第 三 ， 非 基本 
类 型 的 类 对 象 是 通过 ldc 指 令 加 载 到 操作 数 栈 中 的 ， 
将 在 9.3.4 节 修改 ldc 指 令 ， 让 它 文 持 类 对 象 。 而 基本 
类 型 的 类 对 象 ， 虽 然 在 Java 代 码 中 看 起 来 是 通过 字 
面 量 获取 的 ， 但 是 编译 之 后 的 指令 并 不 是 ldc， 而 是 
getstatic。 每 个 基本 类 型 都 有 一 个 包装 类 ， 包 装 类 
中 有 一 个 静态 常量 ， 叫 作 TYPE， 其 中 存放 的 就 是 
基本 类 型 的 类 。 例 如 java.lang.Integer 类 ， 代 人 码 如 
下 : 























public final class Integer extends Number implements Comparab1] 
，// 其 他 代码 


@SuppressWarnings("unchecked") 
public static final Class<Integer> TYPE 
= (Class<Integer>) Class.getPrimitiveClass("int"); 
，// 其 他 代码 





也 丈 是 说 ， 基 本 类 型 的 类 是 通过 getstatic 指 令 
访问 相应 包装 类 的 TYPE 字 段 加 载 到 操作 数 栈 中 
的 。Class.getPrimitiveClass 〈() 是 个 本 地 方法 ， 将 


在 9.3.5 节 实现 它 。 包 装 类 将 在 9.7 小 节 详 细 讨 论 。 





9.3.4 修改]dc 指 令 








和 基本 类型 、 字 人 符 串 字面 值 一 样 ， 类 对 象 字面 
值 也 是 由 ldc 指 令 加 载 的 。 本 节 修 改 ldc 指 令 ， 让 它 
可 以 加 载 类 对 象 。 打 开 
ch09\instructions\constants\ldc.go 文 件 ， 修 改 
_ldc《〈) 图 数 ， 改 动 如 下 : 





func _ldc(frame *rtda.Frame, index uint) { 


stack := frame.OperandStack() 
class := frame.Method().CJlass( ) 
c := class.ConstantPool().GetConstant(index) 


Switch c.(type) { 

case Int32: ... 

case float32: ... 

case string: ... 

case *heap.ClassRef: 
classRef := c.(*heap.ClassRef) 
class0b]j := classRef.ResolvedClass().JClass() 
stack.PushRef (class0bj) 

default: ... 

} 





以 上 只 是 增加 了 一 个 case 语 句 ， 其 他 地 方 没 什 











么 变化 。 如 果 运 行 时 ， 常 量 池 中 的 常量 是 类 引用 ， 
则 解析 类 引用 ， 然 后 把 类 的 类 对 象 推 入 操作 数 栈 
顶 。 





9.3.5 “通过 反射 获取 类 名 


为 了 文 持 通 过 反射 获取 类 名 ， 本 小 节 将 实现 以 
下 4 个 本 地 方法 : 


java.lang.Object.getClass () 
java.lang.Class.getPrimitiveClass () 
java.lang.Class.getName0 () 


java.lang.Class.desiredAssertionStatus0 () 


Object.getClass〈) 就 不 用 多 说 了 ， 筷 返回 对 
象 的 类 对 象 引用 。Class.getPrimitiveClass () 在 
9.3.3 节 提 到 过 ， 基 本 类 型 的 包装 类 在 初始 化 时 会 
用 这 个 方法 给 TPYE 字 段 赋值 。Character 类 是 基本 





类 型 char 的 包装 类 ， 它 在 初始 化 时 会 调用 
Class.desiredAssertionStatus0 〈) 方法 ， 所 以 这 个 方 
法 也 需要 实现 。 最 后 ， 之 所 以 要 实现 getName0 () 
方法 ， 是 因为 Class.getrName() 方法 是 依赖 这 个 本 
地 方法 工作 的 ， 该 方法 的 代码 如 下 : 


// java.lang.Class 
public String getName() { 
String name = this.name; 
if (name == null) 
this.name = name = getName0(); 
return name; 


在 ch09native 目 录 下 创建 java 子 目录 ， 在 java 子 
目录 下 创建 lang 子 目录 ， 然 后 在 lang 目 录 中 创建 
Object.go 文 件 ， 在 其 中 注册 getClass 〈) 本 地 方 
法 ， 代 码 如 下 : 


package lang 

import "jvmgo/ch09/native" 
import "jvmgo/cho9/rtda" 
func init() { 


native.Register("java/lang/Object", "getClass", "()Ljava/la 


继续 编辑 Object.go， 实 现 getClass () 函数 ， 
代码 如 下 : 


// public final native Class<?> getClass(); 
func getClass(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
class := this.Class().JClass() 
frame.OperandStack().PushRef (class) 


是 实现 的 第 一 个 本 地 方法 ， 所 以 有 必要 详细 
解释 一 下 。 首 先 ， 从 局 部 变量 表 中 拿 到 this 引 用 。 
GetThis〈) 方法 其 实 就 是 调用 GetRef (0) ， 不 过 
为 了 提高 代码 的 可 读 性 ， 给 LocalVars 结 构 体 添加 了 

这 个 方法 。 有 了 this 引 用 后 ， 通 过 Class《〈) 方法 拿 
到 它 的 Class 结 构 体 指针 ， 进 而 又 通过 JClass () 方 
法 拿 到 它 的 类 对 象 。 最 后 ， 把 类 对 和 象 推 入 操作 数 栈 

。 这 样 ， 只 用 了 3 行 代 码 ，Object.getClass () 方 











法 丈 实 现 好 了 。 


在 ch09native\java\lang 目 录 下 创建 Class.go 文 
件 ， 在 其 中 注册 3 个 本 地 方法 ， 代 人 码 如 下 : 





package lang 
import "jvmgo/ch09/native" 
import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 
native.Register("java/lang/Class", "getPprimitiveClass", 
"(Ljava/lang/String;)Ljava/lang/Class;", getPrimitiv 
native.Register("java/lang/Class", "getName0", "()Ljava/lan 
native.Register("java/lang/Class", "desiredAssertionStatuscC 
"(Ljava/lang/Class; )Z"，desiredAssertionStatus0 ) 





先 实 现 getPrimitiveClass〈) 方法 ， 代 人 码 如 下 : 





// static native Class<?> getPrimitiveClass(String name); 
func getPrimitiveClass(frame *rtda.Frame) { 


name0b]j := frame.LocalVars().GetRef(0) 
name := heap.GoString(name0bj) 

loader := frame.Method().class().Loader() 
class := loader.LoadClass(name).JClass() 


frame.OperandStack().PushRef (class) 








getPrimitiveClass ( ) 古 议 态 方 法 。 先 从 局 部 变 








量 表 中 拿 到 类 名 ， 这 是 个 Java 字 符 串 ， 需 要 把 它 转 
成 Go 字符 串 。 基 本 类 型 的 类 已 经 加 载 到 了 方法 区 
中 ， 直 接 调用 类 加 载 器 的 LoadClass〈) 方法 获取 即 
可 。 最 后 ， 把 类 对 象 引用 推 入 操作 数 栈 顶 。 下 面 实 
现 getName0 〈) 方法 ， 代 码 如 下 : 


// private native String getName0() ; 
func getNameo(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
class := this.Extra().(*heap.class) 
name := class.JavaName() 
name0b] := heap.JString(class.Loader(), name) 
frame,OperandStack( ).PushRef(nameobj ) 


首先 从 局 部 变量 表 中 拿 到 this 引 用 ， 这 是 一 个 
类 对 象 引 用 ， 通 过 Extra〈) 方法 可 以 获得 与 之 对 应 
的 Class 结 构 体 指针 。 然 后 拿 到 类 名 ， 转 成 Java 字 人 符 
串 并 推 入 操作 数 栈 顶 。 注 意 这 里 需要 的 是 
java.lang.Object 这 样 的 类 名 ， 而 非 java/lang/Object。 


Class 结 构 体 的 JavaName〈) 方法 返回 转换 后 的 类 
名 ， 代 码 如 下 : 


func (self *Class) JavaName() string { 
return strings.Replace(self.name, "/", ".", -1) 


} 


本 书 不 讨论 断言 。desiredAssertionStatus0 〔〈 ) 
方法 把 false 推 入 操作 数 栈 顶 ， 代 人 码 如 下 : 


// private static native boolean desiredAssertionStatus0(CJLass 

func desiredAssertionStatusO(frame *rtda.Frame) { 
frame,OperandStack( ) .PushBoolean(false ) 

} 


4 个 本 地 方法 都 实现 好 了 ， 而 且 也 已 经 在 
init《〈) 函数 中 注册 ， 那 么 可 以 进行 测试 了 吗 ? 还 
不 行 ， 因 为 init () 函数 还 没有 机 会 执行 。 编 辑 
chO9\instructions\reserved\invokenative.go 文 件 ， 在 其 


中 导入 lang 包 ， 代 码 如 下 : 


package reserved 

import "jvmgo/cho9/instructions/base" 
import "jvmgo/cho9/rtda" 

import "jvmgo/cho09/native" 

import _ "jvmgo/ch09/native/java/lang" 


如 果 没 有 任何 包 依 赖 lang 包 ， 它 就 不 会 被 编译 
进 可 执行 文件 ， 上 面 的 本 地 方法 也 就 不 会 被 注册 。 
所 以 需要 一 个 地 方 导入 lang 包 ， 把 它 放 在 
invokenative.go 文 件 中 。 由 于 没有 显示 使 用 lang 中 的 
变量 或 函数 ， 所 以 必须 在 包 名 前 面 加 上 下 划 线 ， 否 
则 无 法 通过 编译 。 这 个 技术 在 Go 语言 中 叫 


作 “import for side effect”。 [1] 

















[1] 
https:/ /golang.org/ doc/etfective_go.html#blank_import 


9.3.6 ”测试 本 节 代 三 


打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 代 
码 : 





go install jvmgo\ch09 





命令 执行 完毕 后 ， 在 D: \govworkspace\bin 目录 
下 出 现 ch09.exe 文 件 。 用 ch09.exe 运 行 下 面 的 Java 程 
序 : 





package jvmgo.book.cho9; 
public class GetClassTest { 
public static void main(String[] args) { 

System.out.println(void.class.getName()); // void 
System.out.println(boolean.class.getName()); // boolean 
System.out.println(byte.class.getName()); // byte 
System.out.println(char.class.getName()); // char 
System.out.println(short.class.getName()); // short 
System.out.println(int.class.getName()); // int 
System.out.println(long.class.getName()); // long 
System.out.println(float.class.getName()); // float 
System.out.println(double.class.getName()); // double 
System.out.println(Object.class.getName()); // java.lang 
System.out.println(int[].class.getName()); // [I 
System.out.println(int[][l].class.getName()); // [I[I 


System.out. 
System.out. 
System.out. 
System.out. 
.println(new double[0].getClass().getName( )); 
System.out. 


System.out 


图 9-2 


println(Object[].class.getName()); // [Ljava. 
println(Object[][].class.getName()); // [[Lja 
println(RunNnnable.class.getName()); // java.1a 
println("abc" .getClass().getName())， // java. 


println(new String[0].getclass().getName()); 





GetClassTest 程 序 执行 结果 


9.4 ”人 字 付 串 拼 接 和 String.intern() 方 
二 


9.4.1 Java 类 库 


在 Java 语 言 中 ， 通 过 加 号 来 拼接 字符 串 。 作 为 
优化 ，javac 编 辑 堪 会 把 字符 串 拼接 操作 转换 成 
StringBuilder 的 使 用 。 例 如 下 面 这 段 Java 代 人 码 : 





String hello = "hello,"; 
String world = "world!"; 
String str = hello + world; 
System.out.printin(str); 


很 可 能 会 被 javac 优 化 为 下 面 这 样 : 


String str = new StringBuilder().append("hello,").append("worl 
System.out.printin(str); 


为 了 运行 上 面 的 代码 ， 本 节 将 实现 以 下 3 个 本 
地 方法 : 


* System.arrayCopy () 
. Float.floatToRawlIntBits () 
* Double.doubleToRawLongBits () 


这 些 方法 是 在 哪里 使 用 的 呢 ? 
StringBuilder.append〈) 方法 只 是 调用 了 超 类 的 
append () 方法 ， 代 码 如 下 : 


// jJava.lang.StringBuilder 

@Override 

public StringBuilder append(String str) { 
super.append(str); // 调用 


AbstractStringBuilder.append ( ) 
return thils ， 


} 


AbstractStringBuilder.append〈) 方法 调用 了 
String.getChars〈) 方法 获取 字符 数组 ， 代 人 码 如 下 : 





// java.lang.AbstractStringBuilder 

public AbstractStringBuilder append(String str) { 
if (str == null) return appendNull(); 
int len = str.length(); 
ensureCapacityInternal(count + len); 
str.getchars(0, len, value, count); 
count += len; 
return this; 





String.getChars 〈) 方法 调用 了 
System.arraycopy〈) 方法 拷贝 数组 ， 代 码 如 下 : 





// java. lang.String 
public void getChars(int srcBegin, int srcEnd, char dst[], int 
，// 其 他 代码 


System.arraycopy(value, srcBegin, dst, dstBegin, srcEnd - s 


} 





StringBuilder.toString () 方法 的 代码 如 下 : 





// java.lang.StringBuilder 


Q@Override 
public String toString() { 
// Create a copy, don't share the array 
return new String(value, 0, count); 





它 调 用 了 String 的 构造 函数 ， 这 个 构造 函数 调 
用 了 Arrays.copyOfRange 〈) 方法 ， 代 码 如 下 : 





// java.lang.String 
public String(char value[], int offset, int count) { 
，// 其 他 代码 


this.value = Arrays.copyOofRange(value, offset, offset+count 


} 





Arrays.copyOfRange〈) 调用 了 Math.min () 





// java.util.Arrays 

public static char[] copyofRange(char[] original, int from, in 
int newLength = to - from; 
if (newLength < 0) throw new IllegalArgumentException(from 
char[] copy = new char[newLength]; 
System.arraycopy(original, from, copy, 0, 

Math.min(original.length - from, newLength)); 

return copy; 


Math 类 在 初始 化 时 需要 调用 
Float.floatToRawIntBits () 和 
Double.doubleToRawLongBits 〈) 方法 ， 代 码 如 
s 





package java.1lang; 

public final class Math { 
// Use raw bit-wise conversions on guaranteed non-NaN argur 
private static long negativeZeroFloatBits = Float.floatToR 
private static long negativeZeroDoubleBits = Double.doublelT 





Java 类 库 介 绍 完了 ， 下 面 实现 本 地 方法 。 


9.4.2 ”System.arraycopy 〈() 方法 


在 ch09native\java\lang 目 录 下 创建 System.go 文 
件 ， 在 其 中 注册 arraycopy() 方法 ， 代 码 如 下 : 





package lang 
import "jvmgo/cho9/native" 
import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 
native.Register("java/lang/System", "arraycopy", 
"(Ljava/lang/Object;ILjava/lang/Object;II)V", arrayco 





继续 编辑 System.go， 实 现 arraycopy 〈) 方法 。 
代码 稍微 有 些 复 杂 ， 先 来 看 第 一 部 分 。 











// public static native void arraycopy( 
// Object src, int srcPos, Object dest, int destPos, int lengt 
func arraycopy(frame *rtda.Frame) { 


vars := frame.LocalVars() 
src := vars.GetRef(0) 
srcPos := vars.GetInt(1) 


dest := vars.GetRef(2) 
destPos := Vars.GetInt(3) 
length := vars.GetInt(4) 


二 一 


先 从 局 部 变量 表 中 拿 到 5 个 参数 。 源 数组 和 目 
标 数 组 都 不 能 是 null， 人 否则 按照 System 类 的 Javadoc 


应 该 抛 出 NullPointerException 异 常 ， 代 人 码 如 下 : 





if src == nil || dest == nil { 
panic("java.lang.NullPointerException") 


源 数组 和 目标 数组 必须 兼容 才能 拷贝 ， 否 则 应 
该 抛 出 ArrayStoreExceptio 异 币 ， 代 人 码 如 下 : 


ArrayStoreExcept1io 异 常 ， 代 码 如 下 : 


if !checkArrayCopy(src, dest) { 
panic("java.lang.ArrayStoreException") 


checkArrayCopy 〈) 函数 的 代码 和 后 给 出 。 接 
下 来 检查 srcPos、destPos 和 ]length 参 数 ， 如 果 有 问题 
则 抛 出 IndexOutOfBoundsException 异 常 ， 代 人 码 如 


下 





if SrcPos < 0 || destPos < 0 || length < 0 || 
srcPos+length > src.ArrayLength() || 
destPos+length > dest.ArrayLength() { 
panic("java.lang.IndexOutofBoundsException") 





最 后 ， 参 数 合 法 ， 调 用 ArrayCopy () 函数 进 
行 数组 拷贝 ， 代 人 码 如 下 : 





heap.ArrayCopy(src, dest, srcPos, destPos, length) 
} 





checkArrayCopy《〈) 函数 首先 确保 src 和 dest 都 
是 数组 ， 然 后 检查 数组 类 型 。 如 果 两 者 都 是 引用 数 
组 ， 则 可 以 找 贝 ,否则 两 者 必须 是 相同 类 型 的 基本 
类 型 数组 ， 代 码 如 下 : 








func checkArrayCopy(src, dest *heap.0Object) bool { 


srcClass := src.Class() 
destClass := dest.Class() 
if !srcClass.IsArray() || !'destClass.IsArray() { 


return false 


if srcClass.ComponentClass().IsPrimitive() || 
destClass.ComponentClass().IsPrimitive() { 
return srcClass == destClass 


， 


return true 





Class 结 构 体 的 IsPrimitive () 也 数 判 断 类 是 否 
是 基本 类 型 的 类 ， 代 码 如 下 : 





func (self *Class) IsPrimitive() bool { 
_, Ok := primitiveTypes[self.namel] 
return ok 





真正 的 数组 拷贝 逻辑 在 
ch09\rtda\heap\array_object.go 文 件 中 ， 代 人 码 如 下 : 





func ArrayCopy(src, dst *Object, srcPos, dstPos, length int32) 

switch src.data.(type) { 

case ... 

case [|]int32: 
_Src := src.data.([]int32)[srcPos : srcPos+length] 
_dst := dst.data.([]int32)[dstPos : dstPos+length] 
copy(_dst, _src) 

case [|]*Object: 
_Src := src.data.([]*Oobject)[srcPos : srcPos+length] 
_dst := dst.data,([]*object)[dstPos : dstPos+length] 
copy(_dst, _src) 


利用 Go 的 内 置 函 数 copy () 进行 slice 找 贝 。 为 
了 而 约 篇 幅 ， 上 面 的 代码 只 给 出 了 int 数 组 和 对 象 数 
组 的 case 语 句 ， 其 他 情况 代码 大 同 小 异 。 





9.4.3 Eloat.floatToRawIntBits () 和 


Double.doubleToRawLongBits 〈) 方法 


Float.floatToRawIntBits () 和 
Double.doubleToRawLongBits 〈) 返回 浮 点 数 的 编 
码 ， 这 两 个 方法 大 同 小 异 ， 以 Float 为 例 进行 介绍 。 
在 ch09native\java\lang 目 录 下 创建 Float.go 文 件 ， 在 
其 中 注册 floatToRawIntBits 〈) 本 地 方法 ， 代 码 如 
下 : 


package lang 
import "math" 
import "jvmgo/cho9/native" 
import "jvmgo/cho9/rtda" 
func init() { 
native.Register("java/lang/Float", 
"floatToRawIntBits", "(F)I", floatToRawIntBits) 
} 


Go 语言 的 math 包 提供 了 一 个 类 似 函 数 : 


Float32bits 〈) ， 正 好 可 以 用 来 实现 floatToRaw- 
IntBits 〈) 方法 ， 代 人 码 如 下 : 





// public static native int floatToRawIntBits(float value); 
func floatToRawInNtBits(frame *rtda.Frame) { 
value := frame.LocalVars().GetFloat(0) 
bits := math.Float32bits(value) 
frame.OperandSstack().PushIint(int32(bits)) 
} 


二 一 


9.4.4 _ String.intern 〈) 方法 





第 8 章 讨 论 字 符 串 时 ， 实 现 了 字符 串 池 ， 但 它 
只 能 在 虚拟 机 内 部 使 用 。 下 面 实 现 String 类 的 
intern 〈() 方法 ， 让 Java 类 库 也 可 以 使 用 它 。 在 
ch09wnative\java\lang 目 录 下 创建 String.go， 在 其 中 
注册 intern 〈) 方法 ， 代 人 码 如 下 : 








package lang 

import "jvmgo/cho9/native" 
import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 


native.Register("java/lang/String", "intern", "()Ljava/lang 


} 





继续 编辑 String.go 文 件 ， 实 现 intern 〈) 方法 ， 
代码 如 下 : 





// public native String intern(); 
func intern(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 


interned := heap.InternString(this ) 
frame.OperandStack().PushRef(interned) 





如 果 字 符 串 还 没有 入 池 ， 把 它 放 入 并 返回 该 字 
符 串 ， 人 否则 找到 己 入 池 字 符 串 并 返回 。 这 个 馆 辑 在 
InternString () 函数 中 
(ch09\rtda\heap\string_pool.go) ， 代 码 如 下 : 


func InternString(jStr *Object) *Object { 
goStr := GoString(jStr) 
if internedStr, ok := internedStrings[goStr]; ok { 
return internedStr 


} 
internedStrings[goStr] = jStr 
return jsStr 





字符 串 相关 的 本 地 方法 都 实现 好 了， 下 面 我 们 
进行 测试 。 


9.4.5 ”测试 本 市 代码 


下 和 面 的 Java 程 友 对 字符 串 拼接 和 入 池 进 行 了 测 
试 。 





package jvmgo.book.cho9; 
public class StringTest { 
public static void main(String[] args) { 

String si = "abci1"; 
String s2 = "abc1"; 
System.out.println(s1 == s2); // true 
int x = 1; 
String s3 = "abc" + x; 
System.out.println(s1 == s3); // false 
s3 = s3.intern(); 
System.out.println(s1 == s3); // true 





重新 编译 本 章 代 码 ， 然 后 测试 StringTest 程 序 ， 
结果 如 图 9-3 所 示 。 





图 9-3 StringTest 程 序 执行 结果 


9.5 Object.hashCode () 、equals () 
toString () 


Object 类 有 3 个 非常 重要 的 方法 : hashCode () 
返回 对 象 的 哈 希 码 ; equals 〈) 用 来 比较 两 个 对 象 
是 否 “相同 ”，toString() 返回 对 象 的 字符 串 表示 。 
hashCode〈) 是 个 本 地 方法 ，equals 〈) 和 
toString 〈) 则 是 用 Java 写 的 ， 它 们 的 代码 如 下 : 





package java, Lang ; 
public class Object { 
,'，// 其 他 代码 省 略 


public native int hashCode(); 
public boolean equals(Object obj) { 
return (this == obj); 


} 
public String toString() { 
return getClass().getName() + "@" + Integer.toHexString( 


下 面 实现 hashCode () 方法 。 打 开 
ch09native\java\lang\Object.go， 导 入 unsafe 包 并 注 
册 hashCode() 方法 ， 代 人 码 如 下 : 





package lang 

import "unsafe" 

import "jvmgo/ch09/native" 

import "jvmgo/cho9/rtda" 

func init() { 
native.Register("java/lang/Object", "getClass", "()Ljava/la 
native.Register("java/lang/Object", "hashCode", "()I", hash 

} 





继续 编辑 Object.go， 实 现 hashCode () 方法 ， 
代码 如 下 : 





// public native int hashCode(); 

func hashCode(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
hash := int32(uintptr(unsafe.Pointer(this))) 
frame.OperandSstack().PushIint(hash) 





把 对 象 引 用 (Object 结 构 体 指针 〉 转换 成 
uintptr 类 型 ， 然 后 强制 转换 成 int32 推 入 操作 数 栈 


本 节 只 实现 这 一 个 本 地 方法 。 重 新 编译 本 章 代 
人 码 ， 然 后 测试 下 和 面 的 Java 程 序 : 





package jvmgo.book.cho9; 
public class ObjectTest { 
public static void main(String[] args) { 

Object obj1 = new ObjectTest(); 
Object obj2 = new ObjectTest( ) ， 
System,.out.println(obj1.hashcode( )); 
System.out.println(obj1.toString() )， 
System.out.println(obj1.equals(obj2)); 
System.out.println(obj1i.equals(obj1)); 





ObjectTest 程 序 执行 结果 如 图 9-4 所 示 。 





k. ch09. 0b jectTest 
-2109091616 
jymgo. book, ch09, ObjectTest@8249d0e0 


false 
true 





:\go\workspace\bin> 


图 9-4 ObjectTest 程 序 执行 结果 


9.6 Object.clone () 


Object 类 提供 了 clone〈) 方法 ， 用 来 支持 对 象 
克隆 。 这 也 是 一 个 本 地 方法 ， 代 码 如 下 : 





// java.lang.Object 
protected native Object clone() throws CloneNotSupportedExcept 


本 刷 实 现 这 个 方 e 三 
ch09\native\java\lang\Object.go 文 件 中 注册 done () 
方法 ;代码 如 下 : 





func init() { 
native.Register(jlObject, "getClass", "()Ljava/lang/Class;" 
native.Register(jlObject, "hashCode", "()I", hashCode) 
native.Register(jlObject, "clone", "()Ljava/lang/Object;", 


继续 编辑 Object.go， 实 现 clone () 方法 ， 代 码 
如 下 : 


func clone(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
cloneable := this.Class().Loader().LoadClass("java/lang/Clo 
if I!this.Class().IsIimplements(cloneable) { 
panic("java.lang.CloneNotSupportedException") 


frame.OperandStack().PushrRef(this.cClone()) 





如 果 类 没有 实现 Cloneable 接 口 ， 则 抛 出 
CloneNotSupportedException 异 常 ， 否 则 调用 Object 
结构 体 的 Clone〈) 方法 克隆 对 象 ， 然 后 把 对 象 副 
本 引用 推 入 操作 数 栈 顶 。Clone() 实现 稍微 有 些 
长 ， 把 它 放 在 ch09\rtda\heap\object_clone.go 文 件 
中 ， 代 码 如 下 : 





func (self *Object) Clone() *Object { 
return &0bjectt{ 
class: self.class, 
data: self.cloneData(), 
} 
} 





数据 克隆 逻辑 在 cloneData() 函数 中 ， 人 代码 如 


全 





func (self *Object) cloneData() interface{} { 

switch self.data.(type) { 

case [|]int8: ... 

case [|]int16: ... 

case [juint16: ... 

case []int32: ... 

case [|]int64: ... 

case [|]float32:; ... 

case []float64: ... 

case []*object : 
elements := Self,data.([]*object) 
elements2 := make([]*Object, len(elements)) 
copy(elements2, elements) 
return elements2 

default: // [lSlot 
slots := self.data. (Slots) 
slots2 := newSlots(uint(len(slots))) 
copy(slots2, slots) 
return slots2 

} 

} 





注意 ， 数 组 也 实现 了 Cloneable 接 口 ， 所 以 上 面 
代码 中 的 case 语 句 针 对 各 种 数组 进行 处 理 。 因 为 代 
码 都 大 同 小 异 ， 所 以 只 给 出 了 引用 数组 的 case 语 
句 。default 语 句 对 普通 对 象 进行 殉 隆 。 


重新 编译 本 章 代 码 ， 测 试 下 面 的 Java 程 序 。 


一 


package jvmgo.book.cho9; 
public class CloneTest implements Cloneable { 
private double pi = 3.14; 
@Override 
public CloneTest clone() { 
try { 
return (CloneTest) super.clone(); 
} catch (CloneNotSupportedException e) { 
throw new RuntimeException(e); 
} 


public static void main(String[] args) { 
CloneTest obj1 = new CloneTest(); 
CloneTest obj2 = obj1.clone(); 
obj1.pi = 3.1415926; 
System.out.printlin(obj1.pi); 
System.out,.println(obj2.pI)， 





CloneTest 程 序 执行 结果 如 图 9-5 所 示 。 





.ch09. CloneTest 
3. 1415926 
3. 14 


:\go\workspace\bin> 





图 9-5 ”CloneTest 程 序 执行 结果 


9.7_” 目 动 痕 箱 和 拆 箱 


前 面 讨论 过 ， 为 了 更 好 地 融入 Java 的 对 象 系 
统 ， 每 种 基本 类 型 都 有 一 个 包装 类 与 之 对 应 。 从 
Java 5 开始 ，Java 语 法 增加 了 自动 装 箱 和 拆 箱 
Cautoboxing/unboxing) 能力， 可 以 在 必要 时 把 基 
本 类 型 转换 成 包装 类 型 或 者 反之 。 这 个 增强 完全 是 
由 编译 器 完成 的 ，Java 虚 拟 机 没有 做 任何 调整 。 


愉 int 关 型 为 例 ， 它 的 包 凌 类 是 
java.lang.Integer。 它 提供 了 2 个 方法 来 帮助 编译 器 在 
int 变 量 和 Integer 对 象 之 间 转 换 : 静态 方法 value () 
把 int 变 量 包 装 成 Integer 对 象 ， 实 例 方 法 
intValue《〈) 返回 被 包装 的 int 变 量 。 这 两 个 方法 的 
代码 如 下 : 





package java ,Lang ; 
public final class Integer extends Number implements Comparabl 
， // 其 他 代码 省 略 


private final int Value 
public static Integer Valueof(int i) { 
if (i >= IntegerCache.low && i <= IntegerCache.high) 
return IntegerCache.cache[i + (-IntegerCache.1ow)]; 
return new Integer(i); 


} 

public int intValue() { 
return value; 

} 


} 





由 上 面 的 代码 可 知 ，Integer.valueOf () 方法 
并 不 是 每 次 都 创建 Integer () 对 象 ， 而 是 维护 了 一 
个 缓存 池 IntegerCache。 对 于 比较 小 〈 默 认 是 - 
128~127) 的 int 变 量 ， 在 IntegerCache 初 始 化 时 就 预 
先 加 载 到 了 池 中 ， 需 要 用 时 直接 从 池 里 取 即 可 。 
IntegerCache 是 Integer 类 的 内 部 类 ， 为 了 便于 参考 ， 
下 面 给 出 它 的 完整 代码 。 








private static class IntegerCache { 
static final int low = -128; 


static final int high 
static final Integer cachel[]; 
static { 


5 


int h = 127; // high value may be configured by property 
String integerCacheHighPropValue = 
sun.misc.VM.getSavedProperty("java.1lang.Integer.Intedg 
if (integerCacheHighPropValue != null) { 
try { 
int i = parseInt(integerCacheHighPropValue); 
i = Math.max(i, 127); 
// Maximum array size is Integer .MAX VALUE 
h = Math.min(i, Integer.MAX VALUE - (-low) -1); 
} catch( NumberFormatException nfe) { 
// If the property cannot be parsed into an int, 
} 
} 


high = h; 
cache = new Integer[(high - low) + 工 ] ; 
int j = low; 
for(int k = 0; k < cache.length; k++) 
cache[k] = new Integer(j++); 
// range [-128, 127] must be interned (JLS7 5.1.7) 
assert IntegerCache.high >= 127; 


private IntegerCache() {} 


he 








具体 细 市 就 不 解释 了 ， 需 要 说 明 的 是 
IntegerCache 在 初始 化 时 需要 确定 缓存 池 中 Integer 对 
象 的 上 限 值 ， 为 此 它 调 用 了 sun.misc.VM 类 的 
getSavedProperty 〈) 方法 。 要 想 让 VM 正确 初始 化 
需要 做 很 多 工作 ， 这 个 工作 推迟 到 第 11 章 进行 。 这 


里 先 用 一 个 hack 让 VM.getSavedProperty〈() 方法 返 
回 非 null 值 ， 以 便 IntegerCache 可 以 正常 初始 化 。 


在 ch09native 目 录 下 创建 sun\misc 子 目录 ， 在 其 
中 创建 YM.go 文 件 ， 然 后 在 VM.go 文 件 中 注册 
initialize ( ) 方法 ， 代 人 码 如 下 : 





package misc 
import "jvmgo/cho9/instructions/base" 
import "jvmgo/cho09/native" 
import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 
native.Register("sun/misc/VM", "initialize", "()V", initial 


} 





initialize () 方法 的 实现 如 下 : 





// private static native void initialize(); 

func initialize(frame *rtda.Frame) { 
vmClass := frame.Method().class() 
savedProps := vmClass.GetRefVar("savedProps", "Ljava/util/r 
key := heap.JString(vmClass.Loader(), "foo") 
val := heap.JString(vmClass.Loader(), "bar") 
frame,OperandStack( ).PushRef(SavedProps ) 
frame,OperandStack( ) .PushRef(key ) 
frame,OperandStack( ).PushRef(Vval) 
propsClass := vmClass.Loader().LoadcClass("java/util/Propert 


SetPropMethod := propsClass.GetInstanceMethod("setProperty" 
"(Ljava/lang/String;Ljava/lang/String;)Ljava/lang/Object 
base.InvokeMethod(frame, setPropMethod) 
} 





上 面 的 hack 代 人 码 可 能 有 些 不 好 理解 ， 但 翻译 成 
等 价 的 Java 代 码 后 只 有 一 句 话 : 








private static native void initialize() { 
VM.savedProps.setProperty("foo", "bar") 


上 





后 ， 需 要 修改 invokenative.go， 在 其 中 导入 


最 
misc 包 ， 改 动 如 下 : 





package reserved 

import "jvmgo/cho9/instructions/base" 
import "jvmgo/cho9/rtda" 

import "jvmgo/cho9/native" 

import _ "jvmgo/ch09/native/java/lang" 
import _ "jvmgo/ch09/native/sun/misc" 





重新 编译 本 章 代 人 码 ， 然 后 测试 下 面 的 Java 程 
序 : 





package jvmgo.book.cho9; 

import java.util.ArrayList,; 

import java.util.List; 

public class BoxTest { 

public static void main(String[] args) { 
List<Integer> list = new ArrayList<>(); 
list.add(1); 
list.add(2); 
list.add(3); 
System,.out.println(1List.toString() )， 
for (int x : list) { 
System.out.printlin(x); 

} 





BoxTest 程 序 的 执行 结果 如 图 9-6 所 示 。 





E 命令 提示 符 一 四 xX 
D:\go\workspace\bin>ch09, exe -Xijre C:\Program Files\Java\ijrel. 8.0 .66 jvmgo. bools 
kk. ch09. BoxTest 
[2 





图 9-6 BoxTest 程 序 执行 结果 


9.8 ”本 章 小 结 


本 章 主 要 讨论 了 本 地 方法 调用 ， 以 及 Java 类 库 
中 一 些 最 基本 的 类 。 前 几 章 基 本 上 都 是 围绕 Java 虚 
拟 机 本 身 如 何 工作 而 展开 讨论 。 通 过 本 章 的 学 习 ， 
读者 应 该 对 Java 虚 拟 机 和 Java 类 库 如 何 配合 工作 有 了 


初步 的 了 解 。 下 一 章 将 讨论 异常 处 理 。 


第 10 草 ” 异 冲 处 理 


异常 处 理 是 Java 语 言 非常 重要 的 一 个 语法 ， 本 
章 从 Java 虚 拟 机 的 角度 来 讨论 异常 是 如 何 被 抛 出 和 
处 理 的 。 开 始 本 章 之 前 ， 还 是 先 把 目录 结构 准备 
好 。 复 制 ch09 目 录 ， 改 名 为 ch10。 修 改 main.go 等 文 
件 ， 把 impott 语 名 中 的 ch09 全 都 替换 成 ch10。 本章 
对 目录 结构 没有 太 大 的 调整 。 


10.1 有 弄 币 处 理 概述 





在 Java 语 言 中 ， 异 第 可 以 分 为 两 类 : Checked 
异常 和 Unchecked 寞 常 。Unchecked 异 党 包括 
java.lang.RuntimeException、java.lang.Error 以 及 它 
们 的 子 类 ， 其 他 异常 都 是 Checked 异 党 。 所 有 异常 
都 最 终 继 承 自 java.lang.Throwable。 如 果 一 个 方法 有 
可 能 导致 Checked 异 第 抛 出 ， 则 讼 方法 要 么 需要 捕 
获 该 寞 单 并 有 尝鲜 处 理 ， 要 么 必须 把 该 寞 单列 在 目 己 
的 throws 子 句 中 ， 盏 则 无 法 通过 编译 。Unchecked 措 
第 没有 这 个 限制 。 请 注意 ，Java 虚 拟 机 规范 并 没有 


这 个 规定 ， 这 只 是 Java 语 言 的 语法 规则 。 











异常 可 以 由 Java 虚 拟 机 抛 出 ， 也 可 以 由 Java 代 
人 码 抛 出 。 当 Java 虚 拟 机 在 运行 过 程 中 过 到 比较 严重 


的 问题 时 ， 会 抛 出 java.lang.Error 的 某 个 子 类 ， 如 





StackOverflowError、OutOfMemoryError 等 。 程 序 一 
般 无 法 从 这 种 异 弟 里 恢复 ， 所 以 在 代码 中 通 弟 也 不 


必 关 心 这 类 异常 。 一 部 分 指令 在 执行 过 程 中 会 导致 








Java 虚 拟 机 抛 出 java.lang.RuntimeException 的 某 个 子 


类 ， 如 NullPointerException、 





IndexOutOfBoundsException 等 。 这 类 异常 一 般 是 代 
码 中 的 bug 导 致 的 ， 需 要 格外 注意 。 在 代码 中 抛 出 
和 处 理 异 党 是 由 athrow 指 令 和 方法 的 异 音 处理 表 配 


合 完 成 的 ， 本 曹 将 重点 讨论 这 一 点 。 








在 Java 6 之 前 ，Oracle 的 Java 编 译 器 使 用 jsr、 
jsr_w 和 和 ret 指令 来 实现 finally 子 句 。 从 Java 6 开始 ， 


己 经 不 再 使 用 这 些 指令 ， 本 章 不 讨论 这 三 条 指令 。 





10.2 ”异常 抛 出 


在 Java 代 码 中 ， 异 和 津 是 通过 throw 关 键 字 抛 出 
的 。Java 虚 拟 机 规范 的 3.12 节 给 了 一 个 例子 ， 代 码 
如 下 : 


void cantBeZero(int i) { 
if (i == 0) 
throw new TestExc(); 
} 
} 


上 面 的 方法 编译 之 后 ， 产 生 下 面 的 字 届 码 : 


© iload 1 // 把 参数 
工 〈 


i) 推 入 操作 数 栈 顶 


1 ifne 12 // 如 果 


9， 直 接 执行 


return 指 令 


4 new #2 // 创建 


TestExc 实 例 ， 把 引用 推 入 操作 数 栈 顶 


7 dup // 复制 


TestExc 实 例 引 用 


8 invokespecial #3 // 调用 


TeStExC 构 造 函 数 ( 栈 顶 引 用 已 经 作为 参数 弹出 ) 


11 athrow // 抛 出 异常 


12 return // 方法 返回 





唯一 陌生 的 指令 是 athrow， 将 在 10.4 节 实现 该 








指令 。 从 字 节 码 来 看 ， 异 常 对 象 似乎 也 只 是 普通 的 
对 象 ， 通 过 new 指 令 创 建 ， 然 后 调用 构造 函数 进行 
初始 化 。 这 是 真 的 吗 ? 如 果 查 看 java.lang.Exception 
或 RuntimeException 的 源 代码 就 可 以 知道 ， 这 并 不 
是 真 的 。 它 们 的 构造 函数 都 调用 了 超 类 
java.lang.Throwable 的 构造 函数 。Throwable 的 构造 
函数 又 调用 了 fillInStackTrace 〈) 方法 记录 Java 虚 拟 
机 栈 信 息 ， 这 个 方法 的 代码 如 下 : 





// java.lang.Throwable 
public synchronized Throwable fillInStackTrace() { 
If (stackTrace != null || 
backtrace != null /* Out of protocol state */ ) { 
fillIinSstackTrace(0); 
stackTrace = UNASSIGNED_ STACK; 


return this,; 


fillInStackTrace () 是 用 Java 写 的 ， 必 须 借助 
另外 一 个 本 地 方法 才能 访问 Java 虚 拟 机 栈 ， 这 个 


法 就 是 重 载 后 的 fillInStackTrace (int) 方法 ， 代 码 
如 下 : 





private native Throwable fillIinSstackTrace(int dummy); 





也 就 是 说 ， 要 想 抛 出 寞 弟 ，Java 虚 拟 机 必须 实 
现 这 个 本 地 方法 。 在 10.5 节 中 ， 我 们 会 真正 实现 这 
个 方法 ， 这 里 先 给 它 一 个 空 的 实现 。 在 
chl0\native\java\lang 目 录 下 创建 Throwable.go 文 件 ， 
在 其 中 注册 flInStackTrace (int) 方法 ， 代 码 如 
下 : 











package lang 
import "jvmgo/ch1i0/native" 
import "jvmgo/ch1i0/rtda" 
import "jvmgo/ch1i0/rtda/heap" 
func init() { 
native.Register("java/lang/Throwable", "fillInSstackTrace", 
"(I)Ljava/lang/Throwable;", fillIinSstackTrace) 
} 
// private native Throwable fillIinstackTrace(int dummy); 
func fillIinSstackTrace(frame *rtda.Frame) { 
// 在 


10 .5 节 实 现 


cm 


季 抛 出 暂时 先 讨 论 到 这 里 ， 下 面 介 绍 如 何 处 


已 
= 
理 异 常 。 


10.3” 弄 癌 处 理 表 


异种 处 理 是 通过 try-catch 句 实现 的 ， 还 是 参考 
Java 虚 拟 机 规范 的 3.12 节 ， 里 面 有 一 个 例子 ， 代 码 
如 下 : 


void catchone() { 
try { 
tryItOut( ) ; 
} catch (TestExc e) { 
handleExc(e); 


上 面 的 方法 编译 之 后 ， 产 生 下 面 的 字 节 码 : 


1 aload 0 // 把 局 部 变量 
Ol 


this) 推 入 操作 数 栈 顶 


2 invokevirtual #4 // 调用 


tryItOut( ) 方法 


4 goto 13 // 如 果 


try{} 没 有 抛 出 异常 ， 直 接 执 行 


return 指 令 

7 astore 1 // 否则 ， 异 常 对 象 引 用 在 操作 数 栈 顶 ， 把 它 弹 出 ， 并 放 入 属 
1 

8 aload 0 // 把 


this 推 入 栈 顶 (将 作为 


handleExc( ) 方 法 的 参数 


0) 


9 aload 1 // 把 异常 对 象 引 用 推 入 栈 顶 (将 作为 


handleExc( ) 方 法 的 参数 


工 ) 


10 invokevirtual #5 // 调用 


handleExc( ) 方法 


13 return // 方法 返回 








从 字 市 码 来 看 ， 如 末 没 有 天 和 沼 闻 出 ， 则 会 直接 
goto 到 jreturn 指 令 ， 方 法 正常 返回 。 那 么 如 果 有 异常 
抛 出 ，goto 和 return 之 间 的 指令 是 如 何 执行 的 呢 ? 答 
案 是 查找 方法 的 异常 处 理 表 。 异 常 处 理 表 是 Code 属 
性 的 一 部 分 ， 它 记录 了 方法 是 否 有 能 力 处 理 某 种 异 
常 。 回 顾 一 下 方法 的 Code 属 性 ， 它 的 结构 如 下 : 














Code_attribute { 
U2 attribute name_index; 
u4 attribute_length; 
U2 max_stack; 
U2 max_locals; 
u4 code_length; 
uU1L code[code_ length]; 
U2 exception _ table length; 
{ U2 start_pc; 
U2 end_pc; 
u2 handler_pc; 
U2 catch_type; 
} exception table[exception_table length]; 


U2 attributes count,; 
attribute_info attributes[attributes_ count]; 


异 各 处 理 表 的 每 一 项 都 包含 3 个 信息 : 处 理 哪 
部 分 代码 抛 出 的 异常 、 哪 类 异常 ， 以 及 异种 处 理 代 
码 在 哪里 。 有 具体 来 说 ，start_pc 和 end_pc 可 以 锁定 一 
部 分 字 节 码 ， 这 部 分 字 节 码 对 应 某 个 可 能 抛 出 异常 
的 try{} 代 码 块 。catch_type 是 个 索引 ， 通 过 它 可 以 
从 运行 时 常量 池 中 但 到 一 个 类 符号 引用 ， 解 析 后 的 
类 是 个 异常 类 ， 假 定 这 个 类 是 X。 如 果 位 于 start_pc 
和 end_pc 之 间 的 指令 抛 出 异常 x>， 且 x 是 X( 或 者 X 
的 子 类 ) 的 实例 ，handler_pc 就 指出 负责 异常 处 理 
的 catch{} 块 在 哪里 。 











回 到 catchOne () 方法 ， 它 的 异常 处 理 表 只 有 
如 下 一 项 : 





当 tryItOut 〈) 方法 通过 athrow 指 令 抛 出 
TestExc 卉 党 时 ，Java 虚 拟 机 首先 会 但 找 tryItOut () 
方法 的 异常 处 理 表 ， 看 它 能 否 处 理 该 异常 。 如 果 
能 ， 则 跳 转 到 相应 的 字 节 码 开始 异常 处 理 。 假 设 
tryItOut() 方法 无 法 处 理 异常 ，Java 虚 拟 机 会 进 一 
步 查 看 它 的 调用 者 ， 也 就 是 catchOne() 方法 的 异 
第 处 理 表 。catchOne() 方法 刚好 可 以 处 理 TestExc 
异常 ， 使 catch{} 块 得 以 执行 。 


假设 catchOne() 方法 也 无 法 处 理 TestExc 噶 
常 ，Java 虚 拟 机 会 继续 查找 catchOne() 的 调用 者 
的 异常 处 理 表 。 这 个 过 程 会 一 直 继 续 下 去 ， 直 到 找 
到 某 个 异常 处 理 项 ， 或 者 到 达 Java 虚 拟 机 栈 的 底 
部 。 把 这 部 分 逻辑 放 在 athrow 指 令 中 ， 有 具体 请 看 





10.4 小 节 。 下 面 修改 Method 结 构 体 ， 在 里 面 增加 异 
弟 处 理 表 。 


打开 ch10\rtda\heap\method.go 文 件 ， 给 Method 
结构 体 添加 exceptionTable 字 上 段 ， 代 人 码 如 下 : 





type Method struct { 
，// 其 他 字段 


exceptionTable ExceptionTable 





然后 修改 copyAttributes () 方法 ， 从 Code 属 性 
中 复制 异常 处 理 表 ， 代 码 如 下 : 








func (self *Method) copyAttributes(cfMethod *classfile.MemberI 
if codeAttr := cfMethod.CodeAttribute(); codeAttr != nil { 
，// 其 他 字段 


self.exceptionTable = newExceptionTable(codeAttr .Excepti 
self.class.constantPool) 


稍 后 再 介绍 ExceptionTable 类 型 和 
newExceptionTable () 疯 数 。 继 续 编 辑 method.go 文 
件 ， 给 Method 结 构 体 添加 FindExceptionHandler () 
方 ; 寺 二 二 全 则 下 : 


func (self *Method) FindExceptionHandler(exClass *Class, pc in 
handler := self.exceptionTable.findExceptionHandler(exClass 
If handler != nil { 
return handler.handlerPpc 


return -1 


FindExceptionHandler 〈) 方法 调用 
ExceptionTable.findExceptionHandler 〈) 方法 搜索 
异 弟 处 理 表 ， 如 采 能 够 找到 对 应 的 开间 处 理 项 ， 则 
返回 它 的 handlerPc 字 段 ， 人 否则 返回 -1。Method 结 构 
体 修 改 完 毕 ， 下 面 来 看 ExceptionTable。 


在 ch10Ntda\heap 目 录 下 创建 exception_table.go 


文件 ， 在 其 中 定义 ExceptionTable 类 型 ， 代 码 如 
下 : 





package heap 
import "jvmgo/ch1i0/classfile" 
type ExceptionTable [1]*ExceptionHandler 





ExceptionTable 只 是 []*ExceptionHandler 的 别名 
而 已 ，ExceptionHandler 有 的 定义 如 下 : 





type ExceptionHandler struct { 


StartPcC int 
endPc int 
handlerPc int 
catchType *ClassRef 


} 








4 个 字段 在 前 面 已 经 介绍 过 ， 这 里 不 多 解 
释 。 继 续 编 辑 exception_table.go 文 件 ， 在 其 中 
newExceptionTable () 函数 ， 代 码 如 下 : 


实现 





func newExceptionTable(entries [1]*classfile.ExceptionTableEntr 
cp *ConstantPool) ExceptionTable { 
table := make([]*ExceptionHandler, len(entries)) 


for i, entry := range entries { 
table[i] = &ExceptionHandlert{ 


StartPc : Int(entry,StartPc( ) )， 

endPc : Int(entry,EndPc() )， 

handJlerpPc : int(entry.HandlerPc()), 

catchType: getcatchType(uint(entry.CatchType()), 


} 


return table 








newExceptionTable 〈() 函数 把 class 文 件 中 的 异 
WE 有 一 点 需要 
特别 说 明 : 异常 处 理 项 的 catchType 有 可 能 是 0。 我 
们 知道 0 是 无 效 的 常量 池 索 引 ， 但 是 在 这 里 0 并 非 表 
示 catch-none， 而 是 表示 catch-all， 它 的 用 法 马上 就 
会 看 到 。getCatchType 〈) 函数 从 运行 时 常量 池 中 
查找 类 符号 引用 ， 代 码 如 下 : 








func getCatchType(index uint, cp *ConstantPool) *ClassRef { 
If index == 0 { 
return nil 


了 


return cp.GetConstant(index).(*ClassRef) 


二 一 


继续 编辑 exception_table.go 文 件 ， 实 现 
findExceptionHandler 〈) 方法 ， 代 码 如 下 : 





func (self ExceptionTable) findExceptionHandler (exClass *Class 
pc int) *ExceptionHandler { 
for _, handler := range self { 
if pc >= handler.startPc && pc < handler.endpc { 
if handler.catchType == nil { 
return handler // catch-all 


} 
catchClass := handler.catchType.ResolvedCclass() 
if catchClass == exClass || catchClass.IsSuperClassof 
return handler 
} 
} 
} 


return nil 
} 





异 各 处 理 表 得 找 馆 和 辑 前 面 已 经 描述 过 ， 此 处 不 
再 车 述 。 这 里 注意 两 点 。 第 一 ，startPc 给 出 的 是 
try{} 语 句 块 的 第 一 条 指令 ，endPc 给 出 的 则 是 try{} 
语句 块 的 下 一 条 指令 。 第 二 ， 如 果 catchType 是 
nil (在 class 文 件 中 是 0，， 表 示 可 以 处 理 所 有 异 
症 ， 这 是 用 来 实现 finally 子 句 的 。 














为 了 市 约 遍 幅 ， 本 章 束 不 再 讨论 多 个 catch 块 、 
舱 套 try-catch， 以 及 finally 子 句 等 对 应 的 字 节 人 码 实现 
了 ， 读 者 可 以 阅读 Java 虚 拟 机 规范 的 3.12 市 。 下 一 


节 将 实现 athrow 指 令 。 








10.4 ”实现 athrow 指 令 


athrow 属 于 引用 类 指令 ， 在 
chlO\instructions\references 目 录 下 创建 athrow.go 文 
件 ， 在 其 中 定义 athrow 指 令 ， 代 码 如 下 : 





package references 

import "reflect" 

import "jvmgo/ch1i0/instructions/base" 

import "jvmgo/ch1i0/rtda" 

import "jvmgo/ch1i0/rtda/heap" 

// Throw exception or error 

type ATHROW struct{ base.NoOperandsInstruction } 











athrow 指 令 的 操作 数 是 一 个 异 津 对 象 引 用 ， 从 
操作 数 栈 弹出 。Execute () 方法 的 代码 如 下 : 





func (self *ATHROW) Execute(frame *rtda.Frame) { 
ex := frame.OperandStack().PopRef() 
If ex == Nil { 
panic("java.lang.NullPointerException") 


thread := frame.Thread() 
if !findAndGotoExceptionHandler(thread, ex) { 
handleUncaughtException(thread, ex) 


} 





先 从 操作 数 栈 中 弹出 开关 对 象 引 用 ， 如 宋 该 引 
用 是 null， 则 抛 出 NullPointerException 异 常 ， 人 否则 看 
是 否 可 以 找到 并 跳 转 到 异常 处 理 代码 。 
findAndGotoExceptionHandler () 函数 的 代码 如 
下 : 





func findAndGotoExceptionHandler(thread *rtda.Thread, ex *heap 
for { 
frame := thread.CurrentFrame() 
pc := frame.NextPC() - 1 
handlerPC := frame.Method().FindExceptionHandler(ex.Clas 
If handlerPC > 0 
stack := frame.OperandStack() 
stack.clear() 
stack.PushRef (ex) 
frame.SetNextPC(handlerPC) 
return true 


thread.PopFrame() 
If thread.ISStackEmpty() { 
break 


} 


return false 


上 





从 当前 帧 开始 ， 遍 历 Java 虚 拟 机 栈 ， 查 找 方 法 





的 异常 处 理 表 。 假 设 遍 历 到 帧 F， 如 果 在 F 对 应 的 方 
法 中 找 不 到 异常 处 理 项 ， 则 把 F 弹 出 ， 继 续 遍 历 。 
反之 如 果 找 到 了 异常 处 理 项 ， 在 跳 转 到 异常 处 理 代 
码 之 前 ， 要 先 把 F 的 操作 数 栈 清空 ， 然 后 把 异常 对 
象 引用 推 入 栈 顶 。OperandStack 结 构 体 的 Clear () 
方法 是 新 增加 的 ， 后 面 给 出 它 的 代码 。 





如 有 果 人 衣 历 完 Java 虚 拟 机 栈 还 是 找 不 到 异常 处 理 
代码 ， 则 handleUncaughtException 〈) 函数 打印 出 
Java 虚 拟 机 栈 信 息 ， 代 码 如 下 : 


func handleUncaughtException(thread *rtda.Thread, ex *heap ,0bj 
thread.CJlearStack( ) 
JMsg := ex.GetRefVar("detailMessage", "Ljava/lang/String;") 
goMsg := heap.GoString(jMsg) 
printJln(ex.Class().JavaName() + ": " + goMsg) 
stes := reflect.Valueof(ex.Extra()) 
for i := 0; i < stes.Len(); I++ { 
ste := stes.Index(i).Interface().(interface { 
String() string 


printljn("\tat " + ste.String()) 


handleUncaughtException () 函数 把 Java 虚 拟 

机 栈 清空 ， 然 后 打印 出 卉 第 信息 。 由 于 Java 虚 拟 机 
栈 已 经 空 了 ， 上 所 以 解释 器 也 惑 终止 执行 了 。 上 面 的 
代码 使 用 Go 语言 的 reflect 包 打印 Java 虚 拟 机 栈 信 

思 。 可 以 猜 到 ， 政 单 对 象 的 extra 字 段 中 存放 的 束 是 
Java 虚 拟 机 栈 信 息 ， 那 么 这 个 extra 字 段 是 什么 时 候 
设置 的 呢 ? 10.5 节 会 揭晓 答案 。 前 面 的 代码 中 还 有 
几 个 方法 没有 介绍 ， 现 在 依次 给 出 它们 的 代码 。 








OperandStack 结 构 体 的 Clear() 方法 如 下 : 


func (self *OperandStack) Clear() { 
self.size = 0 
for i := range self.slots { 
self.slots[il].ref = nil 
} 
} 


Thread 结 构 体 的 ClearStack () 方法 如 下 : 


func (self *Thread) ClearStack() { 
self.stack.clear() 





它 调 用 了 Stack 结 构 体 的 dlear() 方法 ， 代 码 如 
起 


func (self *Stack) clear() { 
for !self.isEmpty() { 
self .pop() 





athrow 指 令 实现 后 ， 还 需要 修改 
ch10\instructions\factory.go 文 件 ， 在 
NewInstruction〈) 函数 中 增加 athrow 指 令 的 case 语 


句 ， 为 了 节约 篇 幅 这 里 就 不 给 出 代码 了 。 


10.5 Java 虚拟 机 栈 信 息 


回 到 ch10native\java\lang\Throwable.go 文 件 ， 
在 其 中 定义 StackTraceElement 结 构 体 ， 代 码 如 下 : 


type StackTraceElement struct { 


fileName string 
className string 
methodName string 
lineNumber int 


} 


StackTraceElement 结 构 体 用 来 记录 Java 虚 拟 机 
栈 帧 信息 : lineNumber 字 上 段 给 出 帧 正在 执行 哪 行 代 
人 码 ; methodName 字 上 段 给 出 方法 名 ; className 字 段 
给 出 声明 方法 的 类 名 ; fieName 字 段 给 出 类 所 在 的 
文件 名 。 下 面 实 现 java.lang.Throwable 的 
fillInStackTrace () 本 地 方法 ， 代 码 如 下 : 


// private native Throwable fillIinstackTrace(int dummy); 


func fillInStackTrace(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
frame.OperandSstack().PushrRef(this) 
stes := createStackTraceElements(this, frame.Thread()) 
this.SetExtra(stes) 





重点 在 createStackTraceElements () 函数 里 ， 
代码 如 下 : 





func createStackTraceElements(t0bj *heap.0bject，thread *rtda. 
[j*StackTraceElement { 
skip := distanceToObject(tObj.Class()) + 2 
frames := thread.GetFrames()[skip:] 
stes := make([]*StackTraceElement, len(frames)) 
for i, frame := range frames { 
stes[i] = createStackTraceElement (frame) 
} 


return stes 





这 个 函数 需要 解释 一 下 。 由 于 栈 顶 两 帧 正在 执 
行 fllInStackTrace (int〉 和 fillInStackTrace () 方 
法 ， 所 以 需要 跳 过 这 两 帧 。 这 两 帧 下 面 的 几 帧 正在 
执行 寞 第 类 的 构造 孙 数 ， 所 以 也 要 跳 过 ， 具 体 要 跳 


过 多 少 巾 数 则 要 看 异常 类 的 继承 层次 。 








distanceToObject 〈) 函数 计算 所 需 跳 过 的 帆 数 ， 代 
人 码 如 下 : 


func distanceToObject(class *heap.Class) int { 
distance := 0 
for c := class.SuperClass(); c != nil; c = c.SuperClass() { 
distance++ 


return distance 


计算 好 需要 跳 过 的 帧 之 后 ， 调 用 Thread 结 构 体 
的 GetFrames《〈) 方法 拿 到 完整 的 Java 虚 拟 机 栈 ， 然 
后 reslice 一 下 就 是 真正 需要 的 帧 。GetFrames 〈) 方 
法 只 是 调用 了 Stack 结 构 体 的 getFrames() 方法 ， 
代码 如 下 : 





func (self *Thread) GetFrames() []*Frame { 
return self.stack.getFrames() 


' 


下 面 是 getFrames () 方法 的 代码 。 


func (self *Stack) getFrames() []*Frame { 
frames := make([]*Frame, 0, self.size) 
for frame := self,. top; frame != nil; frame = frame.lower { 
frames = append(frames, frame) 


return frames 





createStackTraceElement () 也 数 根 据 帧 创建 
StackTraceElement 实 例 ， 代 人 码 如 下 : 





func createStackTraceElement(frame *rtda.Frame) *StackTraceEle 
method := frame.Method ( ) 
class := method.class() 
return &StackTraceElement{ 
fileName: class.SourceFile(), 
className: class.JavaName(), 
methodName: method.Name(), 
lineNumber: method.GetLineNumber(frame.NextPC() - 1), 
} 
} 





最 后 实现 Class 结 构 体 的 SourceFile 〈) 方法 和 
Method 结 构 体 的 GetLineNumber 〈) 方法 。 打 开 
class.g0， 给 Class 结 构 体 添加 sourceFile 字 段 ， 代 码 
如 下 : 





type Class Struct { 
，// 其 他 字段 


sourceFile string 





SourceFile () 是 getter 方 法 ， 这 里 就 不 给 出 代 
人 码 了 。 接 下 来 需要 修改 newClass () 函数 ， 从 class 
文件 中 读 取 源 文件 名 ， 改 动 如 下 : 





func newClass(cf *classfile.ClassFile) *Class { 
class := &Classt{} 
，// 其 他 代码 


class.sourceFile = getSourceFile(cf) 
return class 


} 





在 3.4.3 市 讨论 过 ， 源 文件 名 在 ClassFile 结 构 的 
属性 表 中 ，getSourceFile 〈) 隐 数 提取 这 个 信息 ， 
代码 如 下 : 





func getSourceFile(cf *classfile.ClassFile) string { 


if sfAttr := cf.SourceFileAttribute(); sfAttr != nil { 
return sfAttr.FileName() 


return "Unknown" 


} 





注意 ， 并 不 是 每 个 class 文 件 中 都 有 源 文件 信 
居 ， 这 个 因 编 译 时 的 编译 器 选项 而 异 。Class 结 构 体 
改 完了 ， 下 面 修改 Method 结 构 体 。 打 开 
method.go， 给 Method 结 构 体 添加 lineNumberTable 
字段 ， 改 动 如 下 : 





type Method Struct { 
，// 其 他 字段 


lineNumberTable *classfile.LineNumberTableAttribute 





然后 修改 copyAttributes () 方法 ， 从 class 文 件 
中 提取 行 号 表 ， 代 人 码 如 下 : 





func (self *Method) copyAttributes(cfMethod *classfile.MemberI 
if codeAttr := cfMethod.CodeAttribute(); codeAttr != nil { 


self.maxStack = codeAttr .MaxStack( ) 

self.maxLocals = codeAttr .MaxLocals'( ) 

self.code = codeAttr.Ccode() 

self.lineNumberTable = codeAttr.LineNumberTableAttribute 

self.exceptionTable = newExceptionTable(codeAttr .Excepti 
self.class.constantPool) 





最 后 添加 GetLineNumber 〈) 方法 ， 代 码 如 
下 : 





func (self *Method) GetLineNumber(pc int) int { 
If self,.IsNative() { 
return -2 


if self.lineNumberTable == nil { 
return -1 


} 


return self.lineNumberTable.GetLineNumber(pc) 





和 源 文件 名 一 样 ， 并 不 是 每 个 方法 都 有 行 号 
表 。 如 果 方 法 没有 行 号 表 ， 自 然 也 就 查 不 到 pc 对 应 
的 行 号 ， 这 种 情况 下 返回 -1。 本 地 方法 没有 字 节 
码 ， 这 种 情况 下 返回 -2。 剩 下 的 情况 调用 
LineNumberTableAttribute 结 构 体 的 





GetLineNumber 〈) 方法 查找 行 写 ， 代 码 如 下 : 





func (self *LineNumberTableAttribute) GetLineNumber(pc int) in 
for i := len(self.lineNumberTable) - 1; i >= 0; i-- { 
entry := self.lineNumberTable[i] 
if pc >= int(entry.startPpc) { 
return int(entry.1lineNumber) 
} 
} 
return -1 


上 





上 面 的 代码 在 classfilevattr_line_number_table.go 
文件 中 ， 行 号 表 的 更 多 信息 请 参考 3.4.7 节 。 








10.6 ”测试 本 章 代 码 


打开 命令 行 窗口 ， 执 行 下 面 的 命令 编译 本 章 代 
位。 





go install jvmgo\ch10 





命令 执行 完毕 后 ， 在 D: \goNvworkspace\bin 目录 
下 出 现 ch10.exe 文 件 。 本 ch10.exe， 测 试 下 面 的 
Java 程 序 。 





package jvmgo.book.ch10; 
public class ParseIntTest { 
public static void main(String[] args) { 
foo(args); 


private static void foo(String[] args) { 
try { 
bar (args); 
} catch (NumberFormatException e) { 
System.out.println(e.getMessage()); 
} 
} 
private static void bar(String[] args) { 
if (args.length == 0) { 
throw new IndexOutOofBoundsException("no args!"); 


} 
int x = Integer.parseIint(args[0]); 
System.out.println(x); 





笔者 使 用 不 同 的 参数 进行 测试 ， 结 果 如 图 10-1 
所 示 。 


命令 提示 符 


D:\go\workspace\bin>chl10. exe -Xire “C:\Program Files\Java\irel. 8.0 66” jvmgo. bool 
k. chl0. ParselntTest 123 


pd 


CA] 


D:\go\workspace\bin>ch10. exe -Xire “C:\Program Files\Java\irel.8.0 6 
k. chl0. ParselntTest abc 
For input string: “abc” 


D:\go\workspace\bin>chl10. exe -Xjre “C:\Program Files\Java\ijrel. 8.0 .66”jvmgo.boo 
k. ch10. ParseIntTest 
java. lang. IndexDOutDOfBoundsException: no args! 

at jymgo. book. chl0, ParseIntTest. bar (ParselIntTest,. java:19) 

at jvmeo. book. ch10. ParseIntTest. foo(ParseIntTest. java:11) 

at jwvmgo. book. chl0. ParseIntTest. main(ParseIntTest. java:6) 


D:\go\workspace\bin> 





图 10-1 ParselntTest 程 序 测试 结果 


10.7 本 章 小 结 


本 章 讨 论 了 异常 抛 出 和 处 理 、 异 常 处 理 表 、 


athtr ow 指令 等 ， 下 一 章 将 讨论 类 加 载 器 。 


第 11 章 ”结束 


在 第 7 章 讨 论 了 方法 调用 和 返回 ， 在 第 8 章 讨论 
了 数组 和 字符 串 。 经 过 整整 8 章 的 努力 之 
后 ，“Helo，World! ”终于 出 现在 了 控制 台 上 。 

过 比较 遗憾 的 是 ， 由 于 java.lang.System 类 还 没有 被 
正确 初始 化 ， 直 接 调用 System.outptintn () 方法 会 
导致 NulPointerException 异 常 抛 出 。 为 此 修改 了 
invokevirtual 指 令 ， 对 println () 方法 做 了 特殊 处 
理 。 本 章 将 弥补 这 个 遗 由 ， 把 这 个 hack 从 代码 中 贡 
除 ， 让 Java 虚 拟 机 可 以 真正 在 控制 台 上 打印 数字 和 
字符 串 。 


本 章 也 是 本 书 的 最 后 一 章 ， 在 结尾 会 对 全 书 内 
进行 简要 回顾 。 开 始 本 章 之 前 ， 还 是 先 把 目录 结 


时 


构 准 备 好 。 复 制 cn10 目 录 ， 改名 为 ch11。 修 改 
main.go 等 文件 ， 把 impott 语 多 中 的 ch10 全 都 替换 成 
ch11。 本 章 对 目录 结构 没有 太 大 的 调整 。 


11.1 System 类 是 如 何 被 初始 化 的 


大 家 都 知道 ，System 类 有 3 个 公开 的 静态 常 
量 : out、err 和 in。 其 中 out 和 er 用 于 向 标准 输出 流 
和 标准 错误 流 中 写 入 信息 ，in 用 于 从 标准 输入 流 中 
读 取 人 信息。 那么 这 3 个 常量 是 在 哪里 被 赋值 的 呢 ? 
看 一 下 System 类 的 源 代码 : 








// java.lang.System 
public final class System { 
public final static InputStream in = null; 
public final static PrintStream out = null; 
public final static PrintStream err = null; 
/* register the natives via the static initializer. 
* 
* VM will invoke the initializeSystemClass method to compl 
* the initialization for this class separated from clinit. 
* Note that to use properties set by the VM, see the const 
* described in the initializeSystemClass method. 
*/ 
private static native void registerNatives(); 
static { 
registerNatives(); 


，// 其 他 代码 


从 注释 可 知 ，System 类 的 初始 化 过 程 分 为 两 个 
阶段 。 第 一 个 阶段 由 类 初 始 化 方法 完成 ， 在 这 个 方 
法 中 registerNatives 〈) 方法 会 注册 其 他 本 地 方法 。 
第 二 个 阶段 由 VM 完成 ， 在 这 个 阶段 VM 会 调用 


System.initializeSystemClass () 方法 。 那 么 





initializeSystemClass〈) 方法 究竟 干 了 些 什么 呢 ? 
这 个 方法 很 长 ， 而 且 有 很 详细 的 注释 。 去 挥 与 本 节 
讨论 无 天 的 代码 和 注释 之 后 ， 它 的 代码 如 下 : 








人 
* Initialize the System class. Called after thread initializ 
4 

private static void initializeSystemClass() { 


，// 其 他 代码 


FileInputStream fdIn = new FileInputStream(FileDescriptor.i 

FileOutputStream fdout = new FileOutputStream(FileDescripto 

FileOutputStream fdErr = new FileOutputStream(FileDescripto 

SetIno(new BufferedInputStream(fdIn) ) ; 

setOuto(newPrintStream(fdOut, props.getProperty("sun.stdout 

setErro(newPrintStream(fdErr, props.getProperty("sun,.stderr 
，// 其 他 代码 


可 见 in、out 和 err 正 是 在 这 里 设置 的 。 再 来 看 
sun.misc.VM 类 的 源 代码 (VM 类 属于 Oracle 私 有 代 
人 码 ， 并 没有 开源 ， 下 面 是 有 反 编 译 后 的 Java 代 人 码 ) : 


// sun.misc.VM 
public class VM { 
,，// 其 他 代码 


static { 
，// 其 他 代码 


initialize( ); 


private static native void initialize(); 


VM 类 在 初始 化 时 调用 了 initialize() 方法 。 虽 
然 initialize〈) 是 本 地 方法 ， 但 是 可 以 推测 正 是 这 
个 方法 调用 了 System.initializeSystemClass () 方 
法 。 是 否 真 的 是 这 样 笔者 就 不 做 考证 了 ， 下 面 修改 





解释 器 ， 让 System 类 可 以 正确 初始 化 。 


11.2 ”初始 化 System 类 


ji 
chll\instructions\references\invokevirtual.go 文 件 ， 修 
改 invokevirtual 指 令 的 Execute 〈) 方法 ， 把 其 中 的 
hack 代 码 删 掉 。 由 于 只 是 删除 代码 ， 这 里 融 不 做 详 
细 说 明了 。 


接 下 来 打开 chll\native\sun\misc\VM.go 文 件 ， 
删除 heap 包 的 导入 语句 。 原 来 的 initialize () 方法 
也 是 用 hack 方 式 实现 的 ， 需 要 重 写 ， 代 人 码 如 下 : 


// private static native void Initialize()，; 

func initialize(frame *rtda.Frame) { 
classLoader := frame.Method().Class().Loader() 
JlSysClass := classLoader.LoadClass("java/lang/System") 
initSysClass := jlSysClass.GetStaticMethod("initializeSyste 
base.InvokeMethod(frame, initSysClass) 


} 


新 的 实现 只 是 调用 了 
System.initializeSystemClass () 方法 而 已 。 下 面 修 
改 解释 器 ， 让 和 它 在 执行 主 类 的 main〈) 方法 之 前 先 
调用 VMLinitialize 〈) 方法 。 为 了 让 代码 的 可 读 性 
更 好 ， 将 对 main.go 文 件 进行 比较 大 的 调整 。 打 开 
chll\main.go， 把 下 面 的 代码 复制 进去 : 





package main 
func main() { 
cmd := parseCmd() 
if cmd.versionFlag { 
println("version 0.0.1") 
} else if cmd.helpFlag || cmd.class == "" { 
printUsage() 
} else { 
NewJVM(cmd).start() 


主要 逻辑 都 被 挪 到 了 新 增加 的 ) chll\jvm.go 
文件 中 ， 代 人 码 如 下 : 


package main 
import "fmt" 
import "strings" 


import "jvmgo/ch1ii/classpath" 

import "jvmgo/ch1i1i/instructions/base" 
import "jvmgo/ch1i1i/rtda" 

import "jvmgo/ch1ii/rtda/heap" 

type JVM struct { 


cmd *Cmd 
classLoader *heap.ClassLoader 
mainThread *rtda.Thread 


func newJVM(cmd *Cmd) *JVM {...} 
func (self *JVM) start() {...} 








newJVM() 函数 创建 JVM 结 构 体 实例 ， 代 人 码 
如 下 : 





func newJVM(cmd *Cmd) *JVM { 


cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
classLoader := heap.NewClassLoader(cp, cmd.verboseClassFlag 
return &JVM{ 

cmd: cmd, 


classLoader: classLoader, 
mainThread: rtda.NewThread(), 





start 〈() 方法 先 初 始 化 YM 类 ， 然 后 执行 主 类 
的 main 〈) 方法 ， 代 码 如 下 : 





func (self *JVM) start() { 
self.initVM() 
self.execMain() 





initVM 〈) 先 加 载 sun.mis.VM 类 ， 然 后 执行 其 
类 初始 化 方法 ， 代 码 如 下 : 





func (self *JVM) initVM() { 
vmClass := self.classLoader.LoadClass("sun/misc/VM") 
base.InitClass(self.mainThread, vmClass) 
interpret(self.mainThread, self.cmd.verboseInstFlag) 





execMain 〈) 方法 先 加 载 主 类 ， 然 后 执行 其 
main 〈) 方法 ， 代 人 码 如 下 : 





func (self *JVM) execMain() { 
className := strings.Replace(self.cmd.class, "™.", "/", -1) 
mainClass := self.classLoader.LoadClass(classNanme) 
mainMethod := mainClass.GetMainMethod ( ) 
If mainMethod == nil { 
fmt.Printf("Main method not found in class %s\n", self.c 
return 
} 
argsArr := self.createArgsArray() 
frame := self.mainThread.NewFrame(mainMethod) 
frame.LocalVars().SetRef(0, argsArr) // 给 


main( ) 方 法 传递 


args 参 数 


self.mainThread.PushFrame(frame) 
interpret(self.mainThread, self.cmd.verboseInstFlag) 





execMain() 方法 的 前 半 部 分 代码 是 从 main.go 
文件 中 拷贝 过 来 的 ， 我 们 已 经 比较 熟悉 了 。 后 半 部 
分 代码 需要 解释 的 一 点 是 : 在 调用 main 〈) 方法 之 
前 ， 需 要 给 它 传 递 args 参 数 ， 通过 直接 操作 局 
部 变量 表 实 现 的 。createArgsArray() 方法 把 Go 的 
[string 变 量 转换 成 Java 的 字符 串 数组 ， 代 码 是 从 
interpreter.go 文 件 中 找 贝 过 来 的 ， 如 下 所 示 : 





func (self *JVM) createArgsArray() *heap.Object { 
stringClass := self.classLoader.LoadClass("java/lang/String 
argsLen := uint(len(self.cmd.args)) 
argsArr := stringClass.ArrayClass().NewArray(argsLen) 
JArgs := argsArr.Refs() 
for i, arg := range self.cmd.args { 
JArgs[i] = heap.JString(self.classLoader, arg) 


return argsArr 


二 一 


jvm.go 文 件 改 好 了 ， 下 面 修改 interpret () 也 
数 。 打 开 chll\interpreter.go， 删 除 heap 包 的 导入 语 
名 和 createArgsArray () 函数 ， 然 后 修改 
interpret 〈) 函数 ， 代 码 如 下 : 


func interpret(thread *rtda.Thread, logInst bool) { 
defer catchErr(thread) 
loop(thread, logInst) 

} 


修改 之 后 interpret () 函数 简单 了 许多 ， 直 接 
调用 loop〈) 函数 进入 循环 即 可 。 人 至 此 ， 解 释 器 修 
改 完毕 。 这 就 是 本 间 要 写 的 全 部 代码 吗 ? 并 不 是 。 
为 了 正常 执行 System.initializeSystemClass () 以 及 





System.out.printn 〈) 等 方法 ， 还 需要 实现 很 多 Java 
关 库 中 的 本 地 方法 。 为 了 节约 篇 幅 ， 这 里 惑 不 一 一 
列举 了 ， 请 读者 阅读 随 书 源 代 码 。 下 面 以 

System.out.printn (String〉 为 例 解释 字符 串 是 如 何 








被 打印 到 控制 侣 的 ， 其 他 类型 变量 的 打印 原理 同 字 


侍 串 闫 似 。 


11.3 System.out.printtn () 是 如 何 工 
作 的 


回 到 System.initializeSystemClass〈) 方法 ， 进 
一 步 省 略 之 后 ， 其 代码 如 下 : 





// java.lang.System 

public final static PrintStream out = null; 

private static void initializeSystemClass() { 
，// 其 他 代码 


FileOutputStream fdout = new FileOutputStream(FileDescripto 
setOuto(newPrintStream(fdOut, props.getProperty("sun.stdout 
: // 其 他 代码 





setOut0() 是 个 本 地 方法 ， 代 码 如 下 : 





private static native void setOutoO(PrintStream out); 





newPrintStream 〈) 方法 的 代码 如 下 : 





private static PrintStream newPrintStream(FileOutputStream fos 
If (enc != null) { 
try { 
return new PrintStream(new BufferedOutputStream(fos, 
} catch (UnsupportedEncodingException uee) {} 


return new PrintStream(new BufferedOutputStream(fos, 128), 


} 





由 代码 可 知 ，System.out 常 量 是 PrintStream 类 
型 ， 它 内 部 包装 了 一 个 BufferedOutputStream 实 例 。 

BufferedOutputStream 内 部 又 包装 了 一 个 
FileOutputStream 实 例 。Java 的 io 类 库 使 用 了 装饰 器 
人 模式， 调用 System.out.printtn (String) 方法 之 后 ， 

过 层 层 包装 ， 最 后 到 达 FileOutputStream 类 的 
writeBytes 〈) 方法 。 这 个 方法 无 法 用 Java 代 码 实 
现 ， 所 以 是 个 本 地 方法 ， 其 代码 如 下 : 








// java.io.FileOutputStream 
public class FileOutputStream extends OutputStream { 
，// 其 他 代码 


private native void writeBytes(byte b[], int off, int len, 
throws IOException; 





System.setOut0 〈) 本 地 方法 在 
chll\nativejava\lang\System.go 文 件 中 实现 ， 代 码 如 
下 : 





// private static native void setOutO(PrintStream out ) ， 
func setOutOo(frame *rtda.Frame) { 
out := frame.LocalVars().GetRef(0) 
sysClass := frame.Method().ClLass() 
sysClass.SetRefVar("out", "Ljava/io/PrintStream;", out) 


了 了 


} 








FileOutputStream.writeBytes () 本 地 方法 在 


ch11\native\java\io\FileOutputStream.go 文 件 中 实 





// private native void writeBytes(byte b[], int off, int len, 
// throws IOException; 
func writeBytes(frame *rtda.Frame) { 

vars := frame.LocalVars() 

//this := vars.GetRef(0) 


b := vars.GetRef(1) 

off := Vars.GetInt(2) 

len := vars.GetInt(3) 

//append := vars.GetBoolean(4) 
JBytes := b.Data().([]int8) 

goBytes := castInt8sToUint8s(jBytes) 
goBytes = goBytes[off : off+len] 

os ,Stdout ,Write(goBytes ) 





虽然 同 是 字 节 类 型 ， 但 是 在 Java 语 言 中 byte 是 
有 人 符 写 类 型 ， 在 Go 语言 中 byte 则 是 无 符号 类 型 。 所 
以 这 里 需要 先 把 Java 的 字 节 数组 转换 成 Go 的 [Jbyte 
变量 ， 然 后 再 调用 os.Stdout.Write 〈) 方法 把 它 写 到 
控制 台 。castInt8sSToUint8s〈) 函数 代码 如 下 : 











func castIint8sToUint8s(jBytes []int8) (goBytes [jbyte) { 
ptr := unsafe.Pointer(&]jBytes) 
goBytes = *((*[]byte)(ptr)) 
return 


} 








如 果 读 者 属于 完美 主义 者 ， 很 容易 会 发 现 这 里 
的 小 瑕 疲 : FileOutputStream 应 该 可 以 处 理 任何 文件 
而 不 仅仅 是 标准 输出 。 没 错 ， 不 过 本 章 就 到 此 为 止 


了 ， 感 兴趣 的 读者 可 以 继续 完善 代码 ， 让 
FileOutputStream 可 以 文 持 任何 文件 。 下 面 测试 本 草 
1 


11.4 测试 本 章 代 人 码 
打开 命令 行 窗口 ， 执 行 下 面 的 命令 编译 本 音 代 
码 : 


go install jvmgo\ch11 


命令 执行 完毕 后 ， 在 D: \go\workspace\bin 目 录 
下 出 现 ch11.exe 文 件 。 用 ch11.exe 测 试 HelloWorld 程 
序 ， 结 果 如 图 11-1 所 示 。 





D: EE -Xire "C:\Program Files\Java\irel. 8.0 66”jvmgo. bool 
k. ch01. HelloWorld 
|2 (=3 





D:\go\workspace\bin> 


图 11-1 HelloWorld 程 序 执行 结果 


11.5 总 绪 


/AN 二 口 


本 书 共 11 章 ， 各 章 内 容 如 下 : 


第 1 章 讨 论 了 Java 虚 拟 机 是 如 何 启动 的 ， 介 绍 了 
java 命 令 的 用 法 ， 并 且 实 现 了 一 个 类 似 的 命令 行 工 


上 其。 


AN 


第 2、 第 3、 第 6、 第 8 章 讨 论 了 类 加 载 器 。 其 中 
第 2 章 讨 论 了 Java 虚 拟 机 如 何 搜 索 class 文 件 ， 并 且 实 
现 了 类 路 径 ， 可 以 把 class 文 件 读 到 内 存 中 。 第 3 章 讨 
论 了 class 文 件 结 构 体 ， 并 且 实 现 了 class 文 件 解析 ， 
把 难以 理解 的 字 节 序列 转换 成 了 ClassFile 结 构 体 。 

第 6 章 实 现 了 一 个 简化 版 的 类 加 载 器 ， 进 一 步 处 理 
ClassFile 结 构 体 ， 把 它 转换 成 Class 结 构 体 放 入 方法 
区 。 第 8 章 对 类 加 载 器 进行 了 扩展 ， 使 其 可 以 加 载 


第 4、 第 6 章 讨论 了 运行 时 数据 区 。 其 中 第 4 章 
主要 讨论 了 线程 私有 的 运行 时 数据 区 ， 包 括 Java 虚 
拟 机 栈 、 帧 、 局 部 变量 表 和 操作 数 栈 等 。 第 6 章 主 
要 讨论 了 线程 共享 的 运行 时 数据 区 ， 包 括 方法 区 和 


运行 时 常量 池 等 。 


第 7、 第 9、 第 10 章 讨论 了 方法 调用 。 其 中 第 7 
章 主 要 讨论 了 Java 方 法 的 调用 和 返回 ， 并 且 实 现 了 
相关 指令 。 第 9 章 讨 论 了 本 地 方法 调用 ， 并 且 实 现 
了 Java 类 库 中 一 些 最 重要 的 本 地 方法 。 第 10 章 讨论 
了 异常 处 理 ， 并 且 实 现 了 athfow 指 令 。 


第 5 章 编写 了 一 个 简单 的 解释 器 ， 从 这 一 章 开 


， 我 们 陆续 实现 了 约 200 条 指令 。 在 Java 虚 拟 机 规 


范 已 经 定义 的 205 条 指令 中 ， 只 剩 下 8 条 还 没有 实 
现 ， 分 别 是 : 控制 指令 中 的 jst 和 ret; 扩展 指令 中 的 
jst_w; 引用 类 指令 中 的 invokedynamic、monitorenter 
和 和 monitorexit; 以 及 保留 指令 中 的 breakpoint 和 


impldep2 O 


不 过 遗憾 的 是 ， 有 很 多 重要 的 内 容 没 有 讨论 : 
class 文 件 验 证 、 内 存 管 理 和 垃圾 回收 、 类 加 载 器 的 
委派 模型 、 多 线程 、JIT， 等 等 。 如 果 本 书 有 机 会 
出 第 2 版 ， 和 希望 可 以 涵盖 这 些 内 容 
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